模型序列方法与文档版面结构理解

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

文档图像处理(DIP-Document Image Processing)的研究目的就是要利用计算机从文档图像中获取需要的信息,或者说,是要让计算机模拟人类自身对文档图像进行理解.我们首先提出了问题可解性的概念.当给定一个问题,它可以分解为一系列的模型;该模型序列在一定的测度下是收敛的;而且对于给定的常数t(t<1),存在一个远小于无穷的正数C,使得该序列前C个模型之和对整个问题的覆盖程度大于t,那么,我们就称该问题是模型可解的.其次,我们通过仿真实验表明了版面结构理解问题是模型可解的.我们构造了一个文档版面结构模型序列.在表明版面结构的模型可解性的同时,我们也完成了模型的建立.然后,我们设计了一个文档版面结构模型的识别算法.该算法的功能主要是识别上面模型序列中的十二个结构模型.该算法从文档分层的思想出发,利用投影轮廓分析方法和一些排版方面的知识,首先确定出我们定义的文档版面结构空间模型中的基元.此外,我们还介绍了文档图像处理中其它一些方向的研究工作,包括预处理,版面拆解和区域识别.其中,我们详细介绍了我们在文档倾斜校正和区域识别方面的研究成果.

著录项

作者
潘武模;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科模式识别理论研究
授予学位博士
导师姓名王庆人;
年度 2001
页码
总页数
原文格式 PDF
正文语种中文
中图分类人工智能理论;
关键词
人工智能; 文档图像处理; 版面结构理解; 可解性; 模型序列方法;

相似文献

中文文献
外文文献
专利

1. 基于序列模型的单文档标题生成研究 [J] . 焦利颖 ,郭岩 ,刘悦 . 中文信息学报 . 2021,第001期
2. XML文档数对序列模型与结构相似度算法研究 [J] . 苏慧群 . 湖南广播电视大学学报 . 2010,第003期
3. 基于BiDAF多文档重排序的阅读理解模型 [J] . 杨志明 ,时迎成 ,王泳 . 中文信息学报 . 2018,第011期
4. 基于硬盘序列号的电子文档加密方法 [J] . 徐晨光 ,黎敏 . 商情 . 2014,第021期
5. 基于CPU序列号的电子文档加密方法 [J] . 徐晨光 . 商情 . 2014,第020期
6. LEO:基于序列化的XML文档高效查询处理方法 [C] . 黄宇凯 ,王晓玲 ,周傲英 . 第二十三届中国数据库学术会议（NDBC2006） . 2006
7. 基于带有通配符序列模式和概率主题模型的多文档摘要技术研究 [A] . 强继朋 . 2016

模型序列方法与文档版面结构理解

目录

摘要

著录项

相似文献

相关主题

期刊订阅