首页> 中国专利> 一种以泰语为枢轴的老-汉双语语料库构建方法及装置

一种以泰语为枢轴的老-汉双语语料库构建方法及装置

摘要

本发明涉及以泰语为枢轴的老‑汉双语语料库构建方法及装置,属自然语言处理领域。本发明先对汉语‑泰语平行语料数据进行泰语分词处理;构建老挝语‑泰语双语词典,并利用其将泰语句子逐词翻译成老挝语句子序列,得到候选的老挝语‑泰语平行句对;构建基于双向LSTM的老挝语‑泰语平行句对分类模型,对候选的老挝语‑泰语平行句对进行分类,获取老挝语‑泰语双语平行句对;以泰语为枢轴语言对老挝语和汉语进行匹配,构建老挝语‑汉语双语平行语料库。并根据上述步骤功能模块化制成以泰语为枢轴语言的老‑汉双语平行语料库构建装置,本发明解决了老挝语‑汉语语料稀缺的问题,对老‑汉双语语料库的构建具有一定的理论意义和实际应用价值。

著录项

  • 公开/公告号CN110717341B

    专利类型发明专利

  • 公开/公告日2022-06-14

    原文格式PDF

  • 申请/专利权人 昆明理工大学;

    申请/专利号CN201910856645.8

  • 申请日2019-09-11

  • 分类号G06F40/58;G06F40/289;G06F40/30;G06F16/33;G06F16/35;

  • 代理机构昆明人从众知识产权代理有限公司;

  • 代理人代转嫚

  • 地址 650093 云南省昆明市五华区学府路253号

  • 入库时间 2022-08-23 13:51:00

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号