首页> 中国专利> 基于双语词嵌入技术的并行化词对齐方法

基于双语词嵌入技术的并行化词对齐方法

摘要

本发明公开了一种基于双语词嵌入技术的并行化词对齐方法,在Spark平台上利用MPS‑Neg双语词嵌入技术获得双语词向量表,由双语词向量表获得词对齐模型,进而进行分布式词对齐任务,利用词对齐结果和MPS‑Neg更新双语词向量表,重复以上词对齐和双语词向量表更新操作直至指定迭代次数。本发明解决了现有词对齐方法不能很好适应大规模语料词对齐任务的问题。

著录项

  • 公开/公告号CN107491444B

    专利类型发明专利

  • 公开/公告日2020-10-27

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN201710714527.4

  • 发明设计人 袁春风;黄宜华;黄堃;

    申请日2017-08-18

  • 分类号G06F40/58(20200101);G06F40/284(20200101);

  • 代理机构32235 苏州威世朋知识产权代理事务所(普通合伙);

  • 代理人杨林洁

  • 地址 210093 江苏省南京市鼓楼区汉口路22号

  • 入库时间 2022-08-23 11:18:32

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号