封面
声明
中文摘要
英文摘要
插图索引
表格索引
符号对照表
缩略语对照表
目录
第一章 绪论
1.1 研究背景和意义
1.2 数据库介绍
1.3 公式和文本提取所遇到的困难
1.4 主要工作和创新点
1.5 本文结构安排
第二章 预处理
2.1 图像二值化
2.2 文档去噪
2.3 倾斜校正
2.4 本章小结
第三章 公式和文本提取预处理
3.1 横纵排文档分析
3.2 标题区域识别
3.3 页码识别
3.4 栏数识别
3.5 实验结果和性能分析
3.6 本章小结
第四章 复杂中文版面公式提取
4.1 引言
4.2 传统的公式提取方法
4.3 基于非文本域优先的公式提取
4.4 实验结果和性能分析
4.5 本章小结
第五章 复杂中文版面文本行提取及合并
5.1 引言
5.2 基于非文本域优先的中文版面文本提取
5.3 文档图像文本行合并算法研究
5.4 实验结果和性能分析
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 后期工作展望
参考文献
致谢
作者简介