首页> 中文学位 >复杂背景下低对比度3D字符视觉识别算法研究
【6h】

复杂背景下低对比度3D字符视觉识别算法研究

代理获取

目录

声明

摘要

1.1课题研究背景及意义

1.2.1文字检测识别研究现状

1.2.2冲压字符识别研究现状

1.3论文研究内容与组织架构

第二章多光源成像系统设计与多尺度图像融合算法

2.1多光源成像系统设计

2.2图像融合算法简介

2.3多尺度图像融合算法

2.3.1图像权重值计算

2.3.2高斯金字塔

2.3.3拉普拉斯金字塔

2.3.4图像融合

2.4实验与结果分析

2.5本章小结

第三章基于深度学习的3D冲压字符的检测与定位

3.1深度学习相关知识介绍

3.1.1卷积神经网络简介

3.1.2激活函数

3.1.3数据变换

3.1.4网络初始化方案

3.1.5总体训练流程

3.2改进后处理的深度网络定位算法

3.2.1基础网络介绍

3.2.2改进后处理定位算法

3.2.3损失函数

3.3实验结果与对比分析

3.3.1实验细节描述

3.3.2评价标准

3.3.3字符定位结果与对比分析

3.4本章小结

第四章3D冲压字符序列识别

4.1时序类神经网络

4.1.1循环神经网络

4.1.2长短时记忆网络

4.2文本序列识别网络CRNN

4.3实验结果分析

4.3.1识别前预处理

4.3.2识别结果分析

4.3.3整套算法性能分析

4.4本章小结

5.1本文总结

5.2未来展望

参考文献

硕士学位期间的研究成果及发表的学位论文

致谢

展开▼

摘要

3D冲压字符与背景之间的对比度很低,且在工业环境中,容易受到一些复杂的干扰,如油漆、油污、粉尘、锈蚀、氧化皮等,而采用传统的单次图像采集方法不可避免地造成字符区域细节特征信息丢失的问题,为了实现3D冲压字符的自动检测与识别,本文展开了以下研究:  首先,设计了一种多光源成像系统,在不同方向上依次点亮光源采集一张图像,这可利用3D冲压字符的凹凸特性,增强字符边缘的特征信息。利用采集到的包含有不同特征细节信息的四张图像,使用一种基于拉普拉斯金字塔图像融合的方法进行图像融合,使用的多尺度图像融合方法能够避免感兴趣特征细节信息的丢失,更真实可靠全面的还原场景样貌,实验对比表明,相对于传统采集的图像效果,提出的方法能够更多的还原和保留3D冲压字符的特征,提高字符和背景之间的对比度和区分度。  然后,提出一种改进后处理输出的深度学习字符定位算法,对融合后的图像进行3D冲压字符的检测。该网络以经典的VGG-16架构为基础的特征提取网络,后处理输出有六张网络预测图,包括文本序列预测图,单字符预测图,以及四张数值预测图,用来加权平均计算文本区域的四个项点坐标。实验表明,提出的改进定位算法对于3D冲压字符的定位精确度为99.O%,召回率为96.1%,且相对其它文字检测算法对于3D冲压字符的检测效果具有明显的优势。  最后,使用卷积循环神经网络(CRNN)进行序列字符的识别,该网络主要包括卷积特征提取模块,循环神经网络特征序列编码模块和CTC解码模块。实验测试10000张样本下整套算法的性能,最后总体定位准确率为99.02%,总体识别率为98.80%,表明本文提出的对3D冲压字符的识别算法具有较好的实际运用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号