首页> 中文学位 >文档图像自适应二值化与字符识别
【6h】

文档图像自适应二值化与字符识别

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义第1章 绪论

1.2 国内外研究现状

1.2.1 降质文档图像二值化算法研究现状

1.2.2 多字体文档图像字符识别算法研究现状

1.3 本文主要研究内容

第2章 二值化算法与字符识别算法介绍

2.1 二值化算法

2.1.1 全局阈值算法

2.1.2 局部阈值算法

2.2 当前二值化算法面临的问题

2.3 字符识别算法

2.3.1 基于结构的特征提取方法

2.3.2 基于统计的特征提取方法

2.3.3 神经网络字符识别

2.4 当前字符识别算法存在的难点

2.5 本草小结

第3章 基于支持向量机的自适应二值化算法

3.1 自适应二值化方法

3.1.1 图像的分类

3.1.2 SVM分类模型的建立

3.1.3 SVM训练样本的建立

3.2 实验描述及结果分析

3.2.1 实验环境和测试图像库

3.2.2 图像集自适应选择二值化测试

3.2.3 随手拍摄图像的自适应选择二值化测试

3.3 本草小结

第4章 基于CNN的多字体印刷体汉字识别

4.1 卷积神经网络的基础

4.1.1 卷积神经网络的结构

4.1.2 卷积神经网络的求解

4.2 基于卷积神经网络的字符识别

4.2.1 LeNet-5网络结构

4.2.2 基于改进LeNet-5网络结构的字符识别

4.2.3 改进的LeNet-5结构描述

4.2.4 实验与分析

4.3 本章小结

结论

参考文献

攻读硕士学位期间发表的学术论文及获得成果

致谢

展开▼

摘要

现代办公逐步走向数字化,将纸质文档图像转化为数字电子文档的需求逐渐增多,但是直接将其扫描成图像存储或者人工录入,显然效率低,数据量大。OCR技术使得纸质文档图像到数字文档转存更加便捷,随着OCR技术的逐渐成熟,OCR也开始不断被各行各业所应用。目前OCR适合识别高质量的文档图像,但是对于处理低质量类型的文档图像效果并不理想。因此对于OCR技术应用于识别这些低质量文档图像的算法仍需进一步的研究。
  本文通过研究降质类型文档图像特点,发现对于降质文档图像的OCR处理性能关键在于图像的预处理也就是二值化处理过程,而对于多字体印刷体汉字的识别,需要在保证其具有高效的识别率同时保证识别系统的稳定性。因此本文通过大量研究国内外二值化算法以及字符识别算法,分别对低质量文档图像二值化以及多字体印刷体汉字的识别进行相应的改进研究,以提高OCR系统的识别率和稳定性。本文的主要工作如下:
  第一,本文根据图像的灰度直方图之间即存在一定差异又存在一定联系的特性,分析了经二值化算法分类后的图像灰度直方图特征属性,通过将已有的二值化算法与SVM结合,实现对任意文档图像实现自适应选择二值化算法,该算法首先对DIBCO标准库中的图像进行处理,按优以预定的二值化方法对处理后的图像进行归类,其次提取图像的灰度直方图的特征属性作为特征向量,其对应的图像二值化算法作为标签建立训练样本,最后采用SVM建立自适应选择模型,以达到自适应选择二值化方法的目的。
  第二,本文深入研究了多字体印刷体汉字的特点以及卷积神经网络的结构,提出了一种基于LeNet-5结构的改进网络结构,主要对LeNet-5结构中包括对输入层、隐藏层、激励函数以及输出层进行改进。增加特征提取层的同时又通过减少全连接层来降低训练参数,从而减少训练成本。以改进的LeNet-5网络结构对一级字表中的不同笔画结构的100个不同字体的印刷体的汉字进行识别。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号