文档图像自适应二值化与字符识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

现代办公逐步走向数字化，将纸质文档图像转化为数字电子文档的需求逐渐增多，但是直接将其扫描成图像存储或者人工录入，显然效率低，数据量大。OCR技术使得纸质文档图像到数字文档转存更加便捷，随着OCR技术的逐渐成熟，OCR也开始不断被各行各业所应用。目前OCR适合识别高质量的文档图像，但是对于处理低质量类型的文档图像效果并不理想。因此对于OCR技术应用于识别这些低质量文档图像的算法仍需进一步的研究。
　　本文通过研究降质类型文档图像特点，发现对于降质文档图像的OCR处理性能关键在于图像的预处理也就是二值化处理过程，而对于多字体印刷体汉字的识别，需要在保证其具有高效的识别率同时保证识别系统的稳定性。因此本文通过大量研究国内外二值化算法以及字符识别算法，分别对低质量文档图像二值化以及多字体印刷体汉字的识别进行相应的改进研究，以提高OCR系统的识别率和稳定性。本文的主要工作如下:
　　第一，本文根据图像的灰度直方图之间即存在一定差异又存在一定联系的特性，分析了经二值化算法分类后的图像灰度直方图特征属性，通过将已有的二值化算法与SVM结合，实现对任意文档图像实现自适应选择二值化算法，该算法首先对DIBCO标准库中的图像进行处理，按优以预定的二值化方法对处理后的图像进行归类，其次提取图像的灰度直方图的特征属性作为特征向量，其对应的图像二值化算法作为标签建立训练样本，最后采用SVM建立自适应选择模型，以达到自适应选择二值化方法的目的。
　　第二，本文深入研究了多字体印刷体汉字的特点以及卷积神经网络的结构，提出了一种基于LeNet-5结构的改进网络结构，主要对LeNet-5结构中包括对输入层、隐藏层、激励函数以及输出层进行改进。增加特征提取层的同时又通过减少全连接层来降低训练参数，从而减少训练成本。以改进的LeNet-5网络结构对一级字表中的不同笔画结构的100个不同字体的印刷体的汉字进行识别。

著录项

作者
林凯;
展开▼
作者单位

哈尔滨理工大学;

展开▼
授予单位哈尔滨理工大学;
学科信号与信息处理
授予学位硕士
导师姓名卢迪;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
文档图像; 二值化算法; 光学字符识别; 卷积神经网络;

相似文献

中文文献
外文文献
专利

1. 适于移动终端字符识别环境的自适应多阈值二值化方法 [J] . 朱德利 ,杨德刚 ,胡蓉 . 计算机科学 . 2019,第008期
2. 融合背景估计与U-Net的文档图像二值化算法 [J] . 熊炜 ,王鑫睿 ,王娟 . 计算机应用研究 . 2020,第003期
3. 基于灰度波动的非均匀光照文档图像二值化 [J] . 王刘奎 ,史伟民 ,杨亮亮 . 计算机应用与软件 . 2020,第012期
4. 基于拉普拉斯能量的低质量手写体文档图像二值化 [J] . 冯炎 ,陈汝真 . 科学技术与工程 . 2020,第026期
5. 基于对比度归一化的历史文档图像二值化算法 [J] . FENG Yan . 科学技术与工程 . 2019,第001期
6. 一种改进Laplacian能量的文档图像二值化方法 [C] . Liang Tiancai ,梁添才 ,Liu Jianping . 第17届全国图象图形学学术会议 . 2014
7. 基于深度学习的低质量文档图像二值化算法研究 [A] . 贾绣闳 . 2020

文档图像自适应二值化与字符识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅