文摘
英文文摘
第一章绪论
1.1引言
1.2表格识别的研究现状及存在问题
1.3本文的研究内容及组织结构
第二章表格图像二值化
2.1概述
2.2三种二值化方法的介绍
2.2.1 Ridler和Calvard的聚类方法(RC方法)
2.2.2 Sauvola和Pietaksinen的局部自适应阈值选取方法
2.2.3 Hwang和Fu的基于多尺度Canny边缘的二值化方法
2.3基于非线性对比度增强及LoG算子的混合二值化方法
2.3.1线性对比度增强
2.3.2非线性对比度增强
2.3.3 LoG算子
2.3.4 RC迭代阈值选取
2.4实验结果及讨论
2.5小结
第三章自动倾斜校正算法
3.1图像自动倾斜矫正算法的提出
3.2文档图像倾斜角度自动检测算法的研究
3.2.1现有倾斜角度检测算法的介绍
3.2.2传统的Hough变换方法
3.2.3带参数约束条件的Hough变换——HTPC方法的提出
3.3图像旋转算法的研究
3.3.1传统的图像旋转方法介绍
3.3.2改进的快速图像旋转方法
3.3.3两种图像旋转方法的一致性证明
3.4实验及结果分析
3.5小结
第四章表格字符定位与提取
4.1概述
4.2基于数学形态学的表格线检测及信息恢复算法
4.2.1数学形态学变换的基本知识
4.2.2基于数学形态学变换的表格线检测算法
4.2.3基于数学形态学变换的信息恢复算法
4.3基于COI提取及断裂笔划局部分类恢复的表格字符定位与提取方法
4.3.1提取表格单元格的CTF过程
4.3.2提取单元格字符图像的ECCEA方法
4.3.2提取单元格字符图像的ECCEA方法 4.3.2.1 COI提取
4.3.2提取单元格字符图像的ECCEA方法 4.3.2.2去除COI边框线
4.3.2提取单元格字符图像的ECCEA方法 4.3.2.3断裂笔划恢复
4.3.3字符图像去噪
4.3.4字符图像平滑化
4.4实验
4.5小结
第五章成绩单自动识别系统
5.1 OCR系统的组成
5.2《成绩单自动识别系统》的工作流程
5.3《成绩单自动识别系统》的另外三个组成部分
5.3.1字符分割模块
5.3.2特征提取模块
5.3.3分类器设计模块
5.4系统综合介绍及小结
参考文献
致谢
声明