深度学习在统计机器翻译领域自适应中的应用研究

丁亮12; 姚长青12; 何彦青12; 李辉3

首页> 中文期刊>情报工程 >深度学习在统计机器翻译领域自适应中的应用研究

深度学习在统计机器翻译领域自适应中的应用研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题。为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练语料进行筛选以达到领域自适应的目的。目前统计机器翻译的领域自适应方法以目标数据为基准,着重利用统计技术对训练数据或者翻译模型进行领域的适应调整,缺乏明确的领域标签。本研究在本组之前研究基础上利用深度学习中卷积神经网络（Convolutional neural network,CNN）对短文本进行建模,构建合适的网络结构进行有监督学习,获取完整的句子语义信息,按照待翻译文本的领域信息对训练语料进行归类筛选,获取与待翻译文本领域一致的训练数据,并将其应用到统计机器翻译中。本文采用万方英文摘要在统计机器翻译系统上进行测试,仅利用部分训练数据就得到了超越原始训练数据BLEU打分的翻译结果,证明了本研究的有效性和可行性。

著录项

来源
《情报工程》|2017年第3期|P.64-76|共13页
作者
丁亮12; 姚长青12; 何彦青12; 李辉3;
展开▼
作者单位

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

[1]中国科学技术信息研究所,北京100038 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038 [3]北京市科学技术情报研究所,北京100044;

展开▼
原文格式 PDF
正文语种 CHI
中图分类情报学、情报工作;
关键词
统计机器翻译训练语料选取卷积神经网络深度学习;

相似文献

中文文献
外文文献
专利

1. 深度学习在统计机器翻译领域自适应中的应用研究 [J] . 丁亮 ,姚长青 ,何彦青 . 情报工程 . 2017,第003期
2. 基于领域自适应方法的统计机器翻译模型的优化研究 [J] . 杨玲 . 科学技术创新 . 2021,第005期
3. 基于领域自适应方法的统计机器翻译模型的优化研究 [J] . 杨玲 . 黑龙江科技信息 . 2021,第005期
4. 统计机器翻译领域自适应方法比较研究 [J] . 丁亮 ,李颖 ,何彦青 . 情报工程 . 2016,第004期
5. 统计机器翻译领域自适应方法比较研究 [J] . 丁亮 ,李颖 ,何彦青 . 情报工程 . 2016,第004期
6. 统计机器翻译系统中传统词典的应用研究 [C] . . 第四届全国机器翻译研讨会 . 2008
7. 统计机器翻译领域自适应方法研究 [A] . 刘昊 . 2016

深度学习在统计机器翻译领域自适应中的应用研究

摘要

著录项

相似文献

相关主题

期刊订阅