首页> 中国专利> 基于词向量表示和分类器联合训练的跨语言文本分类方法

基于词向量表示和分类器联合训练的跨语言文本分类方法

摘要

基于跨语言词向量表示和分类器联合训练的跨语言文本分类方法,本发明涉及跨语言文本分类方法。本发明的目的是为了解决现有基于同义词替换的方法分类准确率低,现有基于翻译的方法准确率较高,但是训练翻译器需要大量的语料,而且训练耗时较长,任务的复杂性与时间消耗远远超过了文本分类这一较为简单的任务,因此并不实用的问题。过程为:一:语料预处理:二:通过梯度优化方法优化总的损失函数,使总的损失函数达到最小值,对应一组词向量和一个分类器;三:取概率最大的标签作为目标端语言T上的测试文本的分类结果;与测试集的标准结果对比,得到测试准确率和召回率指标。本发明用于跨语言文本分类领域。

著录项

  • 公开/公告号CN108960317B

    专利类型发明专利

  • 公开/公告日2021-09-28

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN201810680474.3

  • 发明设计人 曹海龙;杨沐昀;赵铁军;高国骥;

    申请日2018-06-27

  • 分类号G06F16/35(20190101);G06K9/62(20060101);G06F40/247(20200101);G06F40/284(20200101);G06F40/242(20200101);G06F40/58(20200101);

  • 代理机构23109 哈尔滨市松花江专利商标事务所;

  • 代理人岳泉清

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2022-08-23 12:33:34

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号