图像中自然场景字符区域定位

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近几年，由于多媒体技术和互联网的蓬勃发展，全世界数字图像容量迅猛增长。我们生活的每一天都能产生数千兆字节容量的图像，这些图像中的字符承载着非常有用的信息，例如交通道路指示牌、街道名称、商店名字、广告牌、海报、书籍封面等。假如能自动定位图像中的字符区域，那么对于图像高层语义的理解、索引和检索有重大意义。本文结合应用数学相关知识，建立数学模型，围绕图像中自然场景字符区域定位，做了如下工作:
　　首先，利用Canny边缘提取算子与NiBlack算子相结合提取出原图像的边缘图，结合两种算子各自的优点，既可以抑制背景和噪声，又可以将邻近的字符区域分开，为后续的字符特征提取做好准备工作;其次，将边缘图进行填充，进行连通区域分析，利用字符特征，如字符宽高比满足一定比例、笔画宽度相似性等多个特征去除部分背景或者非字符区域，得到字符候选区域粗提取。再次，将粗提取的字符候选区域对比着原图像上色，根据字符区域颜色一致性，采用K均值聚类算法聚成三类。因为字符区域较非字符区域具有更多的角点，因此再结合Harris角点检测算法通过判断连通区域角点的数目来区分哪一类为字符区域，哪一类为非字符区域，从而将一部分非字符区域去除，得到字符候选区域精提取;最后，针对精提取的字符候选区域仍会有非字符存在的情况，本文提出基于支持向量机结合HOG特征和LBP特征，对字符候选区域进行识别分类。HOG特征通过计算统计图像局部区域的梯度方向直方图获得，LBP能够很好地描述图像纹理特征，采用主成分分析进行特征选择。用训练好的分类器进行识别分类，最终达到图像中自然场景字符区域准确定位的效果。
　　本文提出的图像中自然场景字符区域定位算法可检测图像中存在多类不同字符的情况，也可检测字符区域像素值较背景低的情况。经实验表明，字符区域定位效果好，且不易受光照、字符字体、复杂背景等因素的影响，具有较好的鲁棒性。

著录项

作者
周军;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科应用数学
授予学位硕士
导师姓名孙艳蕊;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
数字图像; 自然场景; 字符区域; 方向梯度直方图; 局部二值模拟; 支持向量机;

相似文献

中文文献
外文文献
专利

1. 基于改进凸包检测的芯片图像字符区域定位 [J] . 巢渊 ,周伟 ,单文桃 . 图学学报 . 2021,第002期
2. 基于改进凸包检测的芯片图像字符区域定位 [J] . 巢渊 ,周伟 ,单文桃 . 图学学报 . 2021,第002期
3. 图像/视频字符区域定位算法的实现 [J] . 陶志勇 ,孙劲光 ,任晓奎 . 辽宁工程技术大学学报：自然科学版 . 2004,第z1期
4. 自然场景图像中的文本检测及定位算法研究——基于边缘信息与笔画特征 [J] . 李东勤 ,徐勇 ,周万怀 . 重庆科技学院学报（自然科学版） . 2019,第003期
5. 自然场景图像中基于视觉显著性的文本区域检测 [J] . 闵华清 ,郑华强 ,罗荣华 . 华南理工大学学报（自然科学版） . 2012,第008期
6. 一种实用的图像字符定位方法 [C] . 路嗣恩 ,朱玉文 . 2002机器感知与虚拟现实全国学术会议 . 2002
7. 自然场景下字符区域的定位与识别 [A] . 王猛 . 2016

图像中自然场景字符区域定位

目录

摘要

著录项

相似文献

相关主题

期刊订阅