首页> 中国专利> 利用不同词嵌入模型进行协同训练的无监督双语翻译词典获取方法

利用不同词嵌入模型进行协同训练的无监督双语翻译词典获取方法

摘要

本发明公开了一种利用不同词嵌入模型进行协同训练的无监督双语翻译词典获取方法,包括:使用至少两种不同词嵌入模型在源语言和目标语言的单语语料上分别进行训练获得多组不同模型的词嵌入;按照词嵌入训练模型进行分组,并分别进行初始化得到对应初始词典;分别利用当前各模型相对应的词嵌入以及双语翻译词典进行自学习,以更新各个词嵌入分别利用更新后的词嵌入获取当前各自对应的双语翻译词典,并通过协同训练优化过滤提升各个双语翻译词典的置信度;重复第三、第四步直至训练结果收敛,并分别得到各个进程上的最终双语翻译词典。该方法解决了小语种语料资源匮乏的问题,提升了基于无监督学习的单语语料上获取双语翻译词典的无监督方法的效果。

著录项

  • 公开/公告号CN113343719A

    专利类型发明专利

  • 公开/公告日2021-09-03

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202110688705.7

  • 发明设计人 曹海龙;杨沐昀;赵铁军;苏子超;

    申请日2021-06-21

  • 分类号G06F40/58(20200101);G06F40/242(20200101);G06F40/284(20200101);G06N20/00(20190101);

  • 代理机构23211 哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人孙莉莉

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-06-19 12:25:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-14

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号