首页> 中文学位 >联机草书英文单词识别技术的研究与实现
【6h】

联机草书英文单词识别技术的研究与实现

代理获取

目录

文摘

英文文摘

第一章 绪论

第一节 文字识别技术

1.1.1 文字识别技术的分类

1.1.2 文字识别技术的发展

第二节 手写体文字识别技术

1.2.1 脱机手写体识别技术

1.2.2 联机手写体识别技术

第三节 选题背景及意义

第四节 本文研究的主要内容

第五节 论文的组织和结构

第二章 预处理技术

第一节 数据采集

第二节 单词包围盒

第三节 书写范围归一化

第四节 采样点插值

第五节 本章小结

第三章 联机草书英文单词切分技术

第一节 联机草书英文单词切分的主要困难

第二节 英文单词切分算法

3.2.1 笔划垂直方向游程投影

3.2.2 采样点坐标序列极值点检测

3.2.3 正方向极小值点编辑

3.2.4 相关笔划坐标序列合并

3.2.5 特定笔划坐标序列检测

3.2.6 切分算法

第三节 英文单词切分实验

3.3.1 实验数据集

3.3.2 切分实验结果与分析

第四节 本章小结

第四章 联机草书英文字母识别方法

第一节 子序列组合树

第二节 英文字母识别算法

4.2.1 字母识别的主要方法

4.2.2 人工神经网络

4.3.2 字母识别实验

第三节 本章小结

第五章 联机草书英文单词识别方法

第一节 组合字母识别结果

第二节 词典树的建立和检索

5.2.1 字典树的设计

5.2.2 字典树的结构

5.2.3 查字典算法

5.2.4 字典树插入算法

第三节 候选单词评分

5.3.1 可信度分数

5.3.2 词频分数

5.3.3 转移概率剪枝

第四节 单词识别实验结果与分析

第五节 本章小结

第六章 总结与展望

参考文献

致谢

个人简历

展开▼

摘要

文字识别是模式识别领域一个重要的研究热点。在充分考察了目前英文单词识别技术发展现状的基础上,本文着眼于联机草书英文单词识别这一难点问题,进行了深入的研究。采用“先切分,后识别”的方法,即先将每个英文单词切分成英文字母,然后进行英文字母识别,最后将英文字母识别结果组合成英文单词,给出Top10个候选结果。
   本文提出了一种联机草书英文单词切分的方法。该方法把单词采样点序列的极小值点作为候选切分点,然后利用极值点与笔划垂直方向投影之间的关系编辑极小值点,更新候选切分点作为最终切分点。同时,考虑到有些特殊字母书写顺序的问题,提出了将相关笔划坐标序列进行合并,并且标记出特定笔划坐标序列,在采样点子序列组合中提高了算法的效率。由于英文单词切分存在着过分割的现象,本文提出了建立组合树的方法将相邻的采样点子序列进行组合然后再送入英文字母识别引擎进行识别。字母识别引擎采用反向神经网络的方法设计。每个笔划段,给出得分最高的前五个字母识别候选结果。将这些字母按组合树路径排序,采取边组合边查字典的方式,穷举出所有可能的单词结果。每步检索词典,判断是否为“字典单词”,如果不是则停止该条组合路径的识别,起到组合树剪枝的作用。本文的英文字典采用Trie树结构,搜索单词的速度比较快。对于给出的单词候选结果综合可信度分数、词频分数等因素给出单词评分原则,选择出Top10单词作为最终结果。实验证明,本文的方法是可行、有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号