文档图像
文档图像的相关文献在1999年到2023年内共计444篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播
等领域,其中期刊论文87篇、会议论文7篇、专利文献296806篇;相关期刊58种,包括经济技术协作信息、科技创新导报、激光与红外等;
相关会议7种,包括2009全国博士生学术会议——计算机视觉与人工智能、第六届全国搜索引擎和网上信息挖掘学术研讨会、全国第17届计算机科学与技术应用(CACIS)学术会议等;文档图像的相关文献由753位作者贡献,包括孙俊、刘江、王春恒等。
文档图像—发文量
专利文献>
论文:296806篇
占比:99.97%
总计:296900篇
文档图像
-研究学者
- 孙俊
- 刘江
- 王春恒
- 范伟
- 王希常
- 肖柏华
- 熊炜
- 李敏
- 直井聪
- 马磊
- 何源
- 王维兰
- 藤本克仁
- 刘伟
- 宋永红
- 张元林
- 徐晶晶
- 贾馥溪
- 赵楠
- 刘敏
- 姚锟
- 方刚
- 朱军民
- 朱远平
- 王勇
- 王改华
- 章成全
- 胡希驰
- 胥立丰
- 钦夏孟
- 刘鹭
- 史培培
- 王筱娟
- 王鑫睿
- 许梅芳
- 赵诗云
- 黄赟
- 九津见毅
- 佐田以知子
- 冯川
- 刘小镜
- 史操
- 吴俊驰
- 堀田悦伸
- 孟高峰
- 戴汝为
- 曹永刚
- 朱庆生
- 李浩
- 游亚平
-
-
-
许灿辉;
史操;
陈以农
-
-
摘要:
本文采用膨胀卷积网络,实现端到端从文档图像中提取语义结构。膨胀卷积的优势在于提取多尺度上下文信息的同时,并不会损失空间分辨率。该模型使用带残差的膨胀卷积网络提取图像特征,并预测每个像素的类别标签。卷积部分作为特征提取器,能够获得多维度层级图像特征,反卷积部分输出全分辨率的语义预测结果。每个像素的概率值决定其语义类别标签。为了更好地理解分割粒度级别,实验设计了3组不同分割粒级数据集的测试。从文档细粒度到粗粒度级别的分割实验结果表明,语义数据分布的不平衡特点和网络深度都是影响该网络模型的重要因素。该模型可测试于人工智能教育平台英伟达Jetson Nano机器。
-
-
冯炎;
陈汝真
-
-
摘要:
文档图像二值化是文档分析与识别中的一个重要环节.针对低质量手写体文档图像提出了一种二值化算法,算法首先对文档进行相位保持降噪并计算背景修复模板,然后用图像修复算法和形态学闭运算估计文档背景,用背景补偿算法提高文档对比度,接着用背景补偿后的文档图像构造拉普拉斯(Laplacian)能量,最后采用图割算法求得最终二值化结果.实验结果表明,所构造的拉普拉斯能量能够较准确地区分文字和背景,所提二值化算法在DIBCO2018数据集中的实验结果优于同类算法.
-
-
王刘奎;
史伟民;
杨亮亮
-
-
摘要:
光学字符识别的算法研究中,快速有效地将文档图像二值化是图像预处理阶段的关键步骤.在实际拍摄中,由于环境复杂,往往使得采集的图片出现光照不均匀的现象,严重影响后续处理.针对该问题,提出一种基于灰度波动的邻域局部阈值分割方法.根据目标考察点一定邻域范围内水平和竖直方向的灰度波动曲线,提取所有的波峰点和波谷点信息,经过运算确定当前阈值.实验结果表明,该方法处理效果远远优于Niblack、Sau-vola等算法,与经典的Wellner法几乎没有差别.该方法不仅细节保留较好,无断笔伪影现象,且适应不同光照情况.
-
-
宋颖;
易尧华;
汤梓伟;
卢利琼
-
-
摘要:
表格检测是文档分析中的非文本内容检测部分的重要任务,表格检测的高准确率是提高文本检测准确性的必要条件。本研究提出了一种基于深度学习的文档图像分析的表格检测方法。该方法采用级联R-FCN(基于区域的全卷积网络)框架,首先检测出文档图像的公式区域并移除;然后在无公式的文档图像中,检测提取表格与图区域,最后通过参数调节筛选出最终的文档图像表格区域。该方法在ICDAR 2017 Competitionon Page Object Detection数据集上IoU(交叉重合区域)为0.8时,AP值和F1值相应为0.851和0.898。实验结果表明,该方法与传统的基于形态学变换和水平垂直投影的方法相比,可以简单而高效地检测文档图像中的表格。
-
-
宋颖;
易尧华;
汤梓伟;
卢利琼
-
-
摘要:
表格检测是文档分析中的非文本内容检测部分的重要任务,表格检测的高准确率是提高文本检测准确性的必要条件。本研究提出了一种基于深度学习的文档图像分析的表格检测方法。该方法采用级联R-FCN(基于区域的全卷积网络)框架,首先检测出文档图像的公式区域并移除;然后在无公式的文档图像中,检测提取表格与图区域,最后通过参数调节筛选出最终的文档图像表格区域。该方法在ICDAR2017 Competition on Page Object Detection数据集上IoU(交叉重合区域)为0.8时,AP值和F1值相应为0.851和0.898。实验结果表明,该方法与传统的基于形态学变换和水平垂直投影的方法相比,可以简单而高效地检测文档图像中的表格。
-
-
徐学斌;
吾尔尼沙·买买提;
阿力木江·艾沙;
朱亚俐;
库尔班·吾布力
-
-
摘要:
目前针对印刷体维吾尔文档图像的切分研究主要集中在字母切分上,单词切分的文献较少,且存在着标点符号难处理,未合并被拆分书写的单词等问题,同时单词切分准确率有待进一步提高.在对文档图像进行投影处理的基础上,通过K均值聚类算法(K-means)对文本行中所有连体段之间的间隙进行聚类分析得出最佳的间隙判别阈值,然后对所有连体段进行筛选和粗略识别,并结合对间隙的阈值判别结果来确定单词的精确切分点和获取被拆分书写单词的位置信息.在选取的100张文档图像中测试时,结果表明该方法能有效去除标点符号对切分结果的影响,准确合并被拆分书写的单词,并且平均单词切分准确率保持在99%以上.
-
-
-
赵峰涛
-
-
摘要:
当前在不同城市和地区,都在积极的进行数字图书馆建设.这一背景下,如何实现对各种图书馆资源的快速、准确检索,成为备受人们关注的重要问题.本文的研究过程中,以快速纹理密度极值的聚类算法为基础,提出一定的图像检索策略.文章对文档图像纹理持征检索与基于FDPC的文档图像纹理持征检索进行简要的分析,并通过实验,分析区域相关融合纹理持征FDPC图书馆文档图像检索问题.对图书馆图像资源检索问题进行基于内容的检索框架构建,然后采用直方均衡以及中值滤波策略实现图像资源的背景处理和噪声过滤,并通过二值化对图书馆馆藏图像资源进行处理,获得检索框架图像输入的预处理操作,并利用极值密度聚类算法对图像的分类问题进行研究.基于动态距离截断策略对其进行改进,以有效增强算法的聚类效果,进而获促进DPC算法性能的有效提高.最后对所提算法的性能进行实验验证,最终的结果证明,实验所提方法具有较高的检索精度和检索效率,具备一定的应用价值.
-
-
刘天博
-
-
摘要:
图像预处理的效果会直接影响文档图像几何校正处理的难易程度和校正结果的准确性,为了更好的进行校正处理,在校正之前图像预处理是不可缺少的.本文对图像预处理的去噪和二值化处理进行了研究分析,对图像去噪处理从空域法和频域法两类进行分析,对二值化处理从全局阈值法和局部阈值法两类进行分析,通过MATLAB编程软件进行实验,实现了图像预处理中的各算法,得到各算法的优缺点.
-
-
-
-
-
付旻;
高芸;
黄祥林
- 《全国第17届计算机科学与技术应用(CACIS)学术会议》
| 2006年
-
摘要:
在文档图像分析处理中,分割技术十分必要.本文介绍了目前文档图像分割算法中常用的特征,并对针中文文档图像给出了一种分割方法.该方法首先利用Sobel算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行了一系列启发式处理,很好地分割出了文字区域。
-
-
靳从
- 《第七届测量与控制在资源节约、环境保护中的应用学术会议》
| 2003年
-
摘要:
文档在数字化过程中所形成的图像噪声将直接影响到后续字符识别的效果.本文基于文档图像的自身特点,将图像的全局与局部特征相结合,提出了一种去除图像噪声的简单方法,分层次地针对不同类型的噪声采取相应的处理.获得比较理想的效果.实验结果表明,这种方法能够对规范的文档图像进行处理,具有较好的适应性和较高的效率.
-
-
朱庆生;
朱征宇;
傅鹤岗
- 《2002全国软件与应用学术会议(NASAC)》
| 2002年
-
摘要:
提高文档图像压缩比最有潜力的方法是对图、文区域分别采用不同压缩算法,而其关键是有效图文分割.本文针对文档图像特征,介绍一种基于小波系数域隐含状态马尔可夫树结构模型,直接从被分割图像中抽取分类参数,获得多尺度图像分类概率,然后融合多尺度分类结果,实现图文有效分割的方法.该方法综合多尺度小波变换、多尺度判定、多尺度分类依赖、联合条件概率计算等多种图像分割技术.文章主要介绍图像四分块划分策略,小波变换与四分块的对应,隐含马尔可夫树结构模型,以及利用相关尺度上分类块间的依赖关系优化分类结果.
-
-
Liang Tiancai;
梁添才;
Liu Jianping;
刘建平;
Luo Panfeng;
罗攀峰
- 《第17届全国图象图形学学术会议》
| 2014年
-
摘要:
文本图像二值化是将文本从背景中分离的算法,是后继识别任务的关键预处理步骤.低质量的文本图像往往包含各种退化情况,比如,光照不均匀、笔画灰度变化过大、背面渗透等.这些退化情况导致其二值化非常困难.近几年出现的基于Laplacian能量的二值化方法对退化文档进行二值化取得了较好的结果,但是该方法容易导致细长弱笔画丢失.本文提出一种改进Laplacian能量的方法,利用笔画有较强的双边缘响应,对笔画区域的Laplacian算子响应进行加强,使得细长弱笔画得以保留.针对DIBC02013数据测试表明本文的方法能够较好地处理细长弱笔画的二值化问题.