首页> 中文学位 >基于平行语料库的越汉跨语言信息检索研究
【6h】

基于平行语料库的越汉跨语言信息检索研究

代理获取

摘要

随着世界经济一体化的进展,各国之间互联网交流更为广泛、频繁,互联网信息的多语种特点,给交流带来的语言障碍日显突出。为解决语言障碍问题,跨语言信息检索技术应运而生。目前国内外针对母语与英语之间的跨语言检索研究较多,在中国-东盟自贸区成为世界第三大经济体的今天,越汉跨语言信息检索被提到议事日程,对它的研究有着重要的理论意义和实际应用价值。
   本文对跨语言信息检索技术的研究现状进行了分析,主要针对汉语和越南语的跨语言信息检索进行研究,重点解决越汉跨语言信息检索中查询表达式翻译产生的歧义性问题和未登录词问题,并设计实现基于平行语料库的越汉跨语言信息检索系统原型。
   本文的主要内容具体如下:
   (1)把越汉平行语料库应用于词项的选择策略中,提出用“双语共现”方法解决在借助双语词典翻译过程中产生的歧义性问题,从而实现查询表达式更准确的翻译。
   (2)根据汉语和越南语的语言特点和当前的语料情况设计了基于查询表达式翻译的跨语言信息检索中对未登录词的处理框架,主要通过以下方法来解决未登录词问题:
   ①通过构建基于字形的越南语和汉语音译知识实现对人名和地名的音译;
   ②抽取双语平行词对来构建未登录词词库;
   ③提出了一种基于词块划分的组织机构名翻译方法。
   (3)在研究构建越汉双语词典和句子级对齐的越汉平行语料库的基础上实现基于平行语料库的越汉跨语言信息检索系统原型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号