联机草书英文单词识别技术的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

文字识别是模式识别领域一个重要的研究热点。在充分考察了目前英文单词识别技术发展现状的基础上，本文着眼于联机草书英文单词识别这一难点问题，进行了深入的研究。采用“先切分，后识别”的方法，即先将每个英文单词切分成英文字母，然后进行英文字母识别，最后将英文字母识别结果组合成英文单词，给出Top10个候选结果。
　　本文提出了一种联机草书英文单词切分的方法。该方法把单词采样点序列的极小值点作为候选切分点，然后利用极值点与笔划垂直方向投影之间的关系编辑极小值点，更新候选切分点作为最终切分点。同时，考虑到有些特殊字母书写顺序的问题，提出了将相关笔划坐标序列进行合并，并且标记出特定笔划坐标序列，在采样点子序列组合中提高了算法的效率。由于英文单词切分存在着过分割的现象，本文提出了建立组合树的方法将相邻的采样点子序列进行组合然后再送入英文字母识别引擎进行识别。字母识别引擎采用反向神经网络的方法设计。每个笔划段，给出得分最高的前五个字母识别候选结果。将这些字母按组合树路径排序，采取边组合边查字典的方式，穷举出所有可能的单词结果。每步检索词典，判断是否为“字典单词”，如果不是则停止该条组合路径的识别，起到组合树剪枝的作用。本文的英文字典采用Trie树结构，搜索单词的速度比较快。对于给出的单词候选结果综合可信度分数、词频分数等因素给出单词评分原则，选择出Top10单词作为最终结果。实验证明，本文的方法是可行、有效的。

著录项

作者
刘婧;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机软件与理论
授予学位硕士
导师姓名白刚;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字处理软件;
关键词
文字识别; 英文单词; 文字处理; 字符切分;

相似文献

中文文献
外文文献
专利

1. 军队标号草书标绘识别技术研究与实现 [J] . 李祥 ,姜程亮 ,徐宗泽 . 现代计算机（专业版） . 2016,第033期
2. 联机手写字符识别技术研究与实现 [J] . 郭亮勇 ,王国海 . 软件导刊 . 2013,第005期
3. 基于过拆分和合并的联机手写英文单词分割技术 [J] . 赵道华 ,卡尔·艾木都拉 . 电脑知识与技术 . 2009,第007期
4. 基于过拆分和合并的联机手写英文单词分割技术 [J] . 赵道华 ,艾斯卡尔·艾木都拉 . 电脑知识与技术：学术交流 . 2009,第003期
5. 藏文联机手写识别的研究与实现 [J] . 索南尖措 ,关白 ,李雷 . 计算机时代 . 2017,第007期
6. 联机手写英文单词识别系统 [C] . 邹明福 ,钮兴昱 ,刘昌平 . 中国自动化与信息技术研讨会暨2004年学术年会 . 2004
7. 联机手写英文单词识别技术的研究与实现 [A] . 张良文 . 2011

联机草书英文单词识别技术的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅