首页> 中文学位 >印刷体数学公式识别中公式提取和符号定位
【6h】

印刷体数学公式识别中公式提取和符号定位

代理获取

目录

文摘

英文文摘

哈尔滨工程大学学位论文原创性声明

第1章绪论

1.1引言

1.2光学字符识别的缺点

1.3数学公式识别

1.4数学公式图像处理的历史

1.5数学公式图像处理的模型

1.6数学公式的识别

1.6.1数学公式定位

1.6.2数学公式符号识别

1.6.3数学公式分析

1.6.4数学公式分析结果输出

1.6.5数学公式图像处理系统的自动性能评估

1.7本论文所作的工作

第2章中文文档数学公式识别系统总体设计

2.1数学公式识别的难点

2.1.1基本符号分类

2.1.2连接符、分隔符和运算符

2.1.3显示算子和隐式算子

2.1.4环境敏感型符号

2.2识别过程概述

2.3数学公式提取

2.3.1公式提取难点分析

2.3.2国际上数学公式识别方案介绍

2.4中文文档数学公式识别系统的总体设计思想

2.5本章小节

第3章样本采集和图像预处理

3.1引言

3.2样本采集

3.3基本图像处理知识

3.3.1位图的存储结构和读写方式

3.3.2图像的点运算

3.4图像预处理

3.5本章小节

第4章数学公式提取

4.1引言

4.2投影法

4.3独立公式行的提取

4.4内嵌公式提取

4.5本章小节

第5章公式字符定位

5.1引言

5.2基本图像处理知识

5.2.1轮廓提取

5.2.2种子填充

5.2.3轮廓跟踪

5.3字符提取

5.4字符定位

5.5本章小节

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

本课题对当前国际上典型的数学公式识别系统作了一些研究和比较,对其在中文文档识别中暴露出来的问题作了比较细致的讨论.参考了原有系统的一些特点,专门针对中文数学公式文档提出了一个新的数学公式识别系统.由于新的系统充分利用了中国汉字自身所特有的一些特征,所以同原有的系统相比,新的系统在结构上大大简化了,在效率上也有所提高.新系统另外一大优势在于,它可以在不用识别数学字符的情况下,对数学公式进行提取,这样对提高系统的效率有着积极的意义.新系统结构非常简单,主要分三大步:第一步是图像预处理,着一步的主要目的是把彩色图转换成灰色图,去除图像噪声,增强图像清晰度.第二步是数学公式提取,这一步的主要任务是将数学公式同普通文本分割开来,它又分为独立公式行的提取和内嵌公式提取.第三步是公式字符定位,这一步的任务是在已知的公式范围内对公式字符定位,最终取得每个字符的位置和大小.这个系统的主要目的是对数学公式中的字符进行定位,为数学公式识别的后继的结构分析、字符识别等步骤作必要的准备工作,它是整个数学公式识别过程中的一个难点.本系统对独立公式行提取的准确性达到98﹪以上,在内嵌公式提取方面还有待加强,在公式已提取的情况下能够准确地提取出每个连通体.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号