面向短语统计机器翻译的汉日联合分词研究

吴培昊; 徐金安; 张玉洁

首页> 中文期刊> 《计算机工程与应用》 >面向短语统计机器翻译的汉日联合分词研究

面向短语统计机器翻译的汉日联合分词研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Unknown words and word segmentation granularity are two main problems for Chinese-Japanese machine translation. Word segmentation is the first important step for Chinese and Japanese natural language processing. As Chi-nese and Japanese word segmentation is processed with different tagging system and semantic performance, the granularity of word segmentation results should be readjusted to improve the performance of Statistical Machine Translation(SMT). This paper proposes an approach to adjust the word segmentation granularity for improving the performance of SMT, which combines Hanzi-Kanji comparison table and Japanese-Chinese dictionary. Experimental results express that the pro-posed method could adjust the granularity between Chinese and Japanese effectively and improve the performance of SMT. This paper analyses the experimental results and discusses the effect of joint Chinese-Japanese word segmentation granularity for phrase-based SMT.%未登录词与分词粒度是汉日日汉机器翻译研究的两个主要问题。与英语等西方语言不同，汉语与日语词语间不存在空格，分词为汉日双语处理的重要工作。由于词性标注体系、文法及语义表现上的差异，分词结果的粒度需要进一步调整，以改善统计机器翻译系统的性能。提出了面向统计机器翻译的基于汉日汉字对照表及日汉词典信息的汉语与日语的分词粒度调整方法。实验结果表明，该方法能有效地调节源语言和目标语言端的分词粒度，提高统计机器翻译系统的性能。通过对比实验结果，分析探讨分词粒度对汉日双语统计系统性能的影响。

著录项

来源
《计算机工程与应用》 |2015年第5期|116-120141|共6页
作者
吴培昊; 徐金安; 张玉洁;
展开▼
作者单位

北京交通大学;

北京 100044;

北京交通大学;

北京 100044;

北京交通大学;

北京 100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
分词粒度; 汉字对照表; 汉日机器翻译;

相似文献

中文文献
外文文献
专利

1. 基于层次短语的汉蒙统计机器翻译研究 [J] . 王春荣 ,王斯日古楞 ,阿荣 . 内蒙古师范大学学报（自然科学汉文版） . 2013,第003期
2. 基于短语的汉蒙统计机器翻译研究 [J] . 王斯日古楞 ,斯琴图 ,那顺乌日图 . 计算机工程与应用 . 2010,第014期
3. 统计机器翻译中汉维短语对抽取的研究 [J] . 任高举 ,吐尔根·伊布拉音 ,艾山·吾买尔 . 新疆大学学报（自然科学版） . 2010,第003期
4. “第四届中日韩科技信息机构联合研讨会”概述--面向开放获取、数字标识及实用型汉日双向机器翻译系统 [J] . 李颖 ,朱礼军 ,张钧胜 . 数字图书馆论坛 . 2013,第011期
5. 面向语言信息处理的汉日同义句式研究策略 [J] . 李哲 . 山东农业工程学院学报 . 2016,第004期
6. 基于短语的汉维(维汉)统计机器翻译研究 [C] . 董兴华 ,周俊林 ,郭树盛 . 第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 . 2010
7. 基于层次短语模型的蒙-汉统计机器翻译研究 [A] . 苏传捷 . 2014

面向短语统计机器翻译的汉日联合分词研究

摘要

著录项

相似文献

相关主题

期刊订阅