首页> 中文期刊>情报工程 >深度学习在统计机器翻译领域自适应中的应用研究

深度学习在统计机器翻译领域自适应中的应用研究

     

摘要

统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题。为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练语料进行筛选以达到领域自适应的目的。目前统计机器翻译的领域自适应方法以目标数据为基准,着重利用统计技术对训练数据或者翻译模型进行领域的适应调整,缺乏明确的领域标签。本研究在本组之前研究基础上利用深度学习中卷积神经网络(Convolutional neural network,CNN)对短文本进行建模,构建合适的网络结构进行有监督学习,获取完整的句子语义信息,按照待翻译文本的领域信息对训练语料进行归类筛选,获取与待翻译文本领域一致的训练数据,并将其应用到统计机器翻译中。本文采用万方英文摘要在统计机器翻译系统上进行测试,仅利用部分训练数据就得到了超越原始训练数据BLEU打分的翻译结果,证明了本研究的有效性和可行性。

著录项

  • 来源
    《情报工程》|2017年第3期|P.64-76|共13页
  • 作者单位

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

    [1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

  • 原文格式 PDF
  • 正文语种 CHI
  • 中图分类 情报学、情报工作;
  • 关键词

    统计机器翻译 训练语料选取 卷积神经网络 深度学习;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号