首页> 中文学位 >基于模板的汉日机器翻译系统的研究与实现
【6h】

基于模板的汉日机器翻译系统的研究与实现

代理获取

目录

声明

摘要

第1章 引言

1.1 课题背景

1.2 基于实例机器翻译的概述

1.3 基于模板机器翻译的概述

1.4 论文结构

第2章 模板定义及PBMT模型

2.1 模板结构的定义

2.1.1 双语模板的定义

2.1.2 单语模板的定义

2.2 基本文本-模板直接匹配的翻译模型

2.3 预处理技术

2.4 本章小结

第3章 模板的匹配及关系获取

3.1 候选模板选择

3.1.1 模板选取中的Dice系数

3.1.2 候选模板的过滤

3.1.3 相似模板查找算法

3.1.4 检索条件的处理

3.1.5 候选模板的二次过滤问题

3.2 待翻译句子的变换

3.2.1 句子的基本形式变换

3.2.2 由分词错误导致误变换的分析及解决

3.2.3 固定项在待翻译句中的多次出现问题

3.2.4 变换中的其他问题

3.3 相似度计算及映射关系的获取

3.3.1 变换后的句子和模板间相似度

3.3.2 映射关系的获取

3.3.3 相似度计算及映射关系获取实例

3.4 次匹配及映射关系修正

3.5 本章小结

第4章 模板优选及译文生成

4.1 最优模板选择

4.1.1 编辑距离影响因子

4.1.2 短语译文质量的影响

4.1.3 模板覆盖度的影响

4.1.4 模板选优公式及实例说明

4.2 译文生成

4.2.1 译文生成规则

4.2.2 译文生成中的词义消歧

4.2.3 短语引擎构建

4.3 翻译实例

4.4 本章小结

第5章 实验及结果分析

5.1 实验数据

5.2 评测方法

5.2.1 专家评测及标准

5.2.2 机器评测指标

5.3 评测结果及分析

5.3.1 专家评测结果及分析

5.3.2 机器评测结果及分析

5.4 本章小结

第6章 结束语

6.1 研究工作总结

6.2 未来的工作

参考文献

致谢

攻读硕士学位期间发表的论文及参加的项目

展开▼

摘要

随着互联网技术的发展,不同文化间的交流呈现迅速上升的趋势。作为自然语言处理领域最具挑战性课题之一的机器翻译受到越来越多的研究机构的重视。本文在东北大学与日本富士施乐公司多年研究基础上,探讨了基于模板的汉日机器翻译方法(PBMT),并实现了面向真实文本的汉日机器翻译系统。
  模板匹配和短语翻译是影响基于模板机器翻译性能的关键因素。本文通过基于文本-模板直接匹配、模板选优等方法改良了基于模板的机器翻译翻译方法,改善了机器翻译系统的性能。
  本文的主要内容包括:
  (1)本文通过面向机器翻译的文本-模板直接匹配改良了传统的PBMT在模板抽取方面的不足。该方法解决了由于目前句法分析器的性能还难以满足实际需要,使得模板抽出效果不理想,进而影响PBMT的翻译效果的问题。翻译模型根据候选模板对待翻译句子直接进行形式变换,之后计算二者之间的编辑距离,最后用回溯算法获取二者间的映射关系。
  (2)本文通过模板选优模型改良了小模板误匹配和同一个翻译句子存在多个候选匹配模板等问题。模板选优模块是通过分析变换后的句子与源语模板之间的编辑距离、模板中短语译文翻译质量以及候选模板覆盖度三个因素来进行最优模板选择。
  (3)模板翻译中短语的翻译质量直接影响最终译文的质量。本文通过构建独立的短语翻译引擎,并将基于文本-模板直接匹配的翻译引擎作为短语翻译引擎的一个子引擎,在一定程度上解决了模板嵌套的问题,提高短语翻译质量。
  实验结果表明上述方法在汉日机器翻译上取得了令人满意的性能,翻译系统应用效果良好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号