首页> 中文会议>2016年全国高性能计算学术年会 >基于RNN的蒙汉机器翻译语言模型的研究

基于RNN的蒙汉机器翻译语言模型的研究

摘要

双语语料不足,语法结构的特殊性使得蒙汉机器翻译在大范围、长距离的语序差异问题上没有足够的描述能力,不能有效的对语序问题进行预测.针对这一问题,提出一种基于循环神经网络(Recurrent Neural Network RNN)的蒙汉机器翻译语言模型,该模型利用RNN能够动态的对语言中长距离历史和递归结构学习抽象表示的结构特点,从语料库中快速构建高性能翻译候选集,利用当前词的历史信息来预测下一个词出现的概率,解决了传统n-gram语言模型无法利用语句中长距离上下文的问题,同时高维的历史信息能够映射到低维的连续空间,并针对蒙古语黏着语特性通过语义相似度来对词语聚类,将蒙汉双语语料库少而不能有效训练的问题最小化.实验表明,基于RNN的蒙汉机器翻译语言模型在鲁棒性和可扩展性方面明显优于传统n-gram模型.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号