文摘
英文文摘
致谢
插图目录
表格目录
第一章引言
1.1文档处理和文档处理系统
1.2文档理解
1.3文档重建与本文的定位
1.4本文的组成
第二章预处理
2.1倾斜校正
2.1.1基于投影轮廓(Projection Profie)的方法
2.1.2 Hough变换与中文名片倾斜校正
2.1.3斜率直方图与文本谱
2.2二值化
2.3文字和语言识别
第三章版面拆解与区域识别
3.1文档几何结构模型
3.2版面拆解
3.2.1连通体分析
3.2.2自底向上方法
3.2.3自顶向下方法
3.2.4综合方法
3.3基于纹理分析的区域识别方法
3.4假设,验证和反馈与文档图像分析
3.5多值文档处理
第四章基于模型的文档版面结构理解
4.1信函类文档理解
4.2表格处理
4.2.1表格分析与理解
4.2.2表格识别
4.3文档版面结构理解的模型序列方法
4.3.1问题的提出
4.3.2文档模型序列的建立
4.3.3仿真实验的结果
4.3.4结论
第五章文档模型识别
5.1文档模型识别流程
5.2文档图像的层次概念
5.3排版信息分析
5.3.1字号分析
5.3.2线条信息分析
5.4投影轮廓分析与版面结构基元的获取
5.5基元检测算法的评估
5.5.1基于OCR识别结果的方法
5.5.2基于区域比较的性能评估方法
5.5.3算法自身的测试
5.5.4与其它系统的比较测试
5.6模型识别算法的性能分析
第六章结束语
参考文献:
作者在攻读博士学位期间发表和完成论文题录