首页> 中文学位 >图像中自然场景字符区域定位
【6h】

图像中自然场景字符区域定位

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 图像中自然场景字符区域定位的方法概述

1.2.1 国外研究现状图像中自然场景字符区域定位的研究概况

1.2.2 图像中自然场景字符区域定位的主要方法及分析

1.3 图像中自然场景字符区域定位面临的困难及挑战

1.4 本文的主要工作

1.4.1 本文的主要研究内容

1.4.2 本文的组织结构

第2章 图像中字符候选区域提取

2.1 Canny边缘提取算子

2.1.1 Canny算子的基本原理

2.1.2 Canny算子的计算

2.1.3 Canny算子的实现步骤及优点

2.2 NiBlack算子

2.2.1 NiBlack算子的基本理论

2.2.2 NiBlack算子的实现

2.3 字符候选区域粗提取

2.3.1 几何特征

2.3.2 形状规律特征

2.3.3 笔画宽度相似性特征

2.4 字符候选区域精提取

2.4.1 Harris角点检测

2.4.2 K均值聚类算法与Harris角点检测算法相结合

2.5 本章小结

第3章 图像中字符区域定位

3.1 训练样本选取与预处理

3.2 HOG特征提取

3.3 LBP特征提取

3.4 利用主成分分析进行特征选择

3.4.1 主成分分析的基本原理

3.4.2 主成分分析的计算

3.5 本章小结

第4章 实验结果与分析

4.1 本文算法的流程图

4.2 实验结果分析

4.3 算法评估

4.4 本章小结

第5章 总结与展望

5.1 本文的总结

5.2 未来工作展望

参考文献

致谢

展开▼

摘要

近几年,由于多媒体技术和互联网的蓬勃发展,全世界数字图像容量迅猛增长。我们生活的每一天都能产生数千兆字节容量的图像,这些图像中的字符承载着非常有用的信息,例如交通道路指示牌、街道名称、商店名字、广告牌、海报、书籍封面等。假如能自动定位图像中的字符区域,那么对于图像高层语义的理解、索引和检索有重大意义。本文结合应用数学相关知识,建立数学模型,围绕图像中自然场景字符区域定位,做了如下工作:
  首先,利用Canny边缘提取算子与NiBlack算子相结合提取出原图像的边缘图,结合两种算子各自的优点,既可以抑制背景和噪声,又可以将邻近的字符区域分开,为后续的字符特征提取做好准备工作;其次,将边缘图进行填充,进行连通区域分析,利用字符特征,如字符宽高比满足一定比例、笔画宽度相似性等多个特征去除部分背景或者非字符区域,得到字符候选区域粗提取。再次,将粗提取的字符候选区域对比着原图像上色,根据字符区域颜色一致性,采用K均值聚类算法聚成三类。因为字符区域较非字符区域具有更多的角点,因此再结合Harris角点检测算法通过判断连通区域角点的数目来区分哪一类为字符区域,哪一类为非字符区域,从而将一部分非字符区域去除,得到字符候选区域精提取;最后,针对精提取的字符候选区域仍会有非字符存在的情况,本文提出基于支持向量机结合HOG特征和LBP特征,对字符候选区域进行识别分类。HOG特征通过计算统计图像局部区域的梯度方向直方图获得,LBP能够很好地描述图像纹理特征,采用主成分分析进行特征选择。用训练好的分类器进行识别分类,最终达到图像中自然场景字符区域准确定位的效果。
  本文提出的图像中自然场景字符区域定位算法可检测图像中存在多类不同字符的情况,也可检测字符区域像素值较背景低的情况。经实验表明,字符区域定位效果好,且不易受光照、字符字体、复杂背景等因素的影响,具有较好的鲁棒性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号