声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 错误校正研究现状
1.3 研究内容
1.4 结构安排
第二章 相关理论及技术
2.1 错误校正概述
2.1.1 OCR错误类型分析
2.1.2 常见错误校正方法
2.2 语言模型
2.2.1 N元语言模型
2.2.2 马尔科夫模型
2.2.3 最大熵模型
2.3 数据平滑技术
2.3.1 加法平滑
2.3.2 Good-Turing平滑
2.3.3 Katz平滑
2.3.4 Jelinek-Mercer平滑
第三章 蒙古文OCR识别后文档错误校正方法的研究
3.1 蒙古文OCR识别后文档错误校正流程
3.2 蒙古文特点
3.3 语料库的建立
3.3.1 语料简介
3.3.2 语料处理
3.4 OCR字符混淆模型
3.4.1 错误类型分析
3.4.2 字符混淆概率
3.4.3 易错字符统计
3.5 错误校正
第四章 实验
4.1 系统评价指标
4.2 语料库
4.3 语料训练
4.4 实验结果
第五章 结论及展望
5.1 结论
5.2 进一步研究方向
参考文献
致谢