基于单词全局特征的印刷体英文单词识别系统研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文的研究重点是印刷体英文识别技术。传统的印刷体英文识别系统很大程度上依赖于字符分割的好坏。字符分割的难点在于如何解决粘连字符的分割问题，特别是对小字号的字符，目前还没有一个有效的解决方法。　　本文提出了一种基于单词全局特征的特征提取方法。该方法通过对截取的单词二值图像提取全局特征并进行多级的分类和识别，避免了字符分割这一复杂的过程，针对实际应用中常用的且字符粘连情况严重的12号TimesNewRoman字体进行识别得到了较好的识别效果。通过对特征库中的14877个单词进行测试，识别率达到99.7％。基于该方法本人研制开发了在Windows平台上适用的《图文翻译好帮手》系统，它可以帮助金山词霸截取PDF文档中图片格式的单词并进行翻译。该系统具有使用方便、实用性强的特点，通过对大量实际PDF文档进行测试，识别率高达95％。

著录项

作者
吴晓峰;
展开▼
作者单位

中山大学;

展开▼
授予单位中山大学;
学科计算数学
授予学位硕士
导师姓名杨力华;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
OCR; 印刷体英文识别; 字符分割; 特征提取; 分类; 单词全局特征;
入库时间 2022-08-17 10:26:56

相似文献

中文文献
外文文献
专利

1. 印刷体英文单词识别与朗读在辅助阅读中的应用 [J] . 马飞 ,申远 ,孙国瑞 . 电子设计工程 . 2012,第003期
2. 基于局部和全局特征视觉单词的人物行为识别 [J] . 谢飞 ,龚声蓉 ,刘纯平 . 计算机科学 . 2015,第011期
3. 基于BP神经网络的印刷体字符识别系统研究 [J] . 周繁卿 . 电子世界 . 2020,第020期
4. 基于HOG特征和MLP分类器的印刷体维吾尔文识别方法 [J] . 于丽 ,亚森·艾则孜 . 微型电脑应用 . 2017,第006期
5. 一种基于交点特征的印刷体数字识别方法 [J] . 戴静 ,胡钊政 ,白建川 . 电视技术 . 2014,第013期
6. 联机手写英文单词识别系统 [C] . 邹明福 ,钮兴昱 ,刘昌平 . 中国自动化与信息技术研讨会暨2004年学术年会 . 2004
7. 基于HMM的脱机自由手写英文单词识别系统 [A] . 梁佳玉 . 2004

基于单词全局特征的印刷体英文单词识别系统研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅