首页> 中国专利> 用于从图像中提取文本笔划图像的方法和装置

用于从图像中提取文本笔划图像的方法和装置

摘要

本发明提供一种用于从图像中提取文本笔划图像的方法和装置。根据本发明的一个方面,提供了一种用于从图像中提取文本笔划图像的方法,包括:获取图像的边缘信息和梯度信息;对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信息;以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

著录项

  • 公开/公告号CN102810155A

    专利类型发明专利

  • 公开/公告日2012-12-05

    原文格式PDF

  • 申请/专利权人 富士通株式会社;

    申请/专利号CN201110157673.4

  • 申请日2011-05-31

  • 分类号G06K9/00(20060101);G06K9/20(20060101);G06T7/00(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人王萍;王娜丽

  • 地址 日本神奈川县

  • 入库时间 2023-12-18 07:36:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-04-15

    授权

    授权

  • 2013-01-30

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20110531

    实质审查的生效

  • 2012-12-05

    公开

    公开

说明书

技术领域

本发明涉及图像处理领域,更具体地涉及用于从图像中提取文本笔划图 像的方法和装置。

背景技术

在当今的信息处理领域中存在大量的视频文件。存在对这些视频文件进 行有效地检索的需要。对于视频标注、视频搜索等,视频中的文本信息是准 确又简单的线索。因此,如何准确地提取并且识别视频中所包含的文本信息, 对后续的视频标注、视频检索非常重要。

已知的一些提取文笔笔划的技术,存在速度慢、噪声大、对笔划尺度不 敏感等缺点。

需要能够解决上述问题的用于从图像中提取文本笔划图像的方法和装 置。

发明内容

在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面 的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不 是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目 的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前 序。

本发明的目的在于,提供一种用于从图像中提取文本笔划图像的方法和 装置。

根据本发明的一个方面,提供了一种用于从图像中提取文本笔划图像的 方法,包括:获取图像的边缘信息和梯度信息;对所获取的边缘信息和梯度 信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信 息;以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

根据本发明的另一个方面,提供了一种用于从图像中提取文本笔划图像 的装置,包括:信息获取单元,用于获取图像的边缘信息和梯度信息;强化 单元,用于对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化 图像中与文本有关的边缘信息和梯度信息;以及笔划图像获得单元,用于获 得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

另外,本发明的实施例还提供了用于实现上述方法的计算机程序。

此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序 产品,其上记录有用于实现上述方法的计算机程序代码。

通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以 及其他优点将更加明显。

附图说明

参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的 以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。 在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来 表示。

图1是示出根据本发明实施例的用于从图像中提取文本笔划图像的方法 的流程图;

图1A是示意性地示出阶跃信号、脉冲信号、与索贝尔算子对应的信号、 利用索贝尔算子提取阶跃信号的提取结果、利用索贝尔算子提取脉冲信号的 提取结果、对阶跃信号的提取结果取绝对值后得到的信号、对脉冲信号的提 取结果取绝对值后得到的信号、以及相应的经偏移的信号的示意图;

图2是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本 笔划图像的方法的流程图;

图3是示出待处理的原始图像;

图4A-图4H是示出用索贝尔算子卷积后得到的图像;

图5A-图5D是示出通过对经索贝尔算子处理后的图像向相对方向偏移 并合成偏移后的图像所得到的四张图像;

图6A-图6D是示出通过对经索贝尔算子处理后的图像向相反方向偏移 并合成偏移后的图像所得到的四张图像;

图7是示出整合后所得到的细笔划图像;

图8是示出整合后所得到的粗笔划图像;

图9是示出通过过滤处理得到的粗笔划图像;

图10是示出根据本发明实施例的用于从图像中提取文本笔划图像的装 置的框图;

图11是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文 本笔划图像的装置的框图;以及

图12示出了可以用于实施本发明的用于从图像中提取文本笔划图像的 方法和装置的计算设备的举例的结构图。

具体实施方式

下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施 方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出 的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与 本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。

以下参照图1来描述根据本发明实施例的用于从图像中提取文本笔划图 像的方法。

图1是示出根据本发明实施例的用于从图像中提取文本笔划图像的方法 的流程图。如图1所示,在步骤S102中,可以获取图像的边缘信息和梯度 信息。

优选地,可以对代表图像的边缘信息和梯度信息的阶跃信号或脉冲信号 进行分析,并根据分析结果来提取边缘信息和梯度信息。

在图像中,细笔划的图像数据可以呈现为脉冲信号,粗笔划的图像数据 和类似于粗笔划的大尺度对象可以呈现为阶跃信号。可以对脉冲信号进行分 析,并根据其分析结果来提取细笔划的边缘信息和梯度信息。此外,可以对 阶跃信号进行分析,并根据其分析结果来提取粗笔划的边缘信息和梯度信 息,并提取类似于粗笔划的大尺度对象的边缘信息和梯度信息。

以下参照图1A来描述利用索贝尔算子提取阶跃信号的过程和利用索贝 尔算子提取脉冲信号的过程,以及通过偏移处理和合成处理执行加强处理的 过程。

图i示出了阶跃信号,图ii示出脉冲信号,图iii和图iv示出与索贝尔 算子对应的信号,图v示出利用索贝尔算子提取阶跃信号的提取结果,图vi 示出利用索贝尔算子提取脉冲信号的提取结果,图vii示出对阶跃信号的提 取结果取绝对值后得到的信号,图viii示出对脉冲信号的提取结果取绝对值 后得到的信号,以及图ix和图x相应的经偏移的信号的示意图。

应理解,图1A中的坐标及大小仅是示意性的而非限制性的,并且仅旨 在示出相关信号处理的原理。

如图1A所示,通过利用索贝尔算子(如图iii所示)提取阶跃信号(如 图i所示),可以获得单一的谷状信号(如图v所示),而通过利用索贝尔算 子(如图iv所示)提取脉冲信号(如图ii所示),可以获得谷状信号和峰状 信号结合的信号(如图vi所示)。可见,通过利用索贝尔算子来提取阶跃信 号和脉冲信号,可以相应获得差异较大的两种信号(如图v和图vi所示)。

然后,通过稍后描述的强化处理(例如,包括偏移处理和合成处理)可 以强化阶跃信号和脉冲信号,从而提取与脉冲信号对应的细笔划的图像数据 以及与阶跃信号对应的粗笔划的图像数据。

例如,可以对利用索贝尔算子提取出的脉冲信号中的谷状信号(如图vi 所示)取绝对值(即,取谷状信号的大小),得到另一峰状信号(如图viii 所示)。然后将该另一峰状信号和原峰状信号部分(即,利用索贝尔算子提 取到的峰状信号)向相对方向偏移,并将偏移后的该另一峰状信号和原峰状 信号相叠加(如图x所示),从而可以再次加强与该脉冲信号对应的细笔划 的图像数据。此外,可以对利用索贝尔算子提取出的阶跃信号中的谷状信号 (如图v所示)取绝对值,得到又一峰状信号(如图vii所示)。然后偏移该 又一峰状信号(如图ix所示)。

可选地,可以基于预定的过滤条件过滤掉类似于粗笔划的大尺度对象的 边缘信息和梯度信息,而只留下粗笔划的边缘信息和梯度信息。具体的过滤 处理将稍后描述。

可选地,可以根据图像的清晰程度或在需要的情况下,对如图3所示的 原始图像进行滤波。例如,可以利用低通滤波器对原始图像进行滤波,以抑 制图像中的噪声。低通滤波器例如可以是高斯滤波器,但是低通滤波器不限 于此,而可以是本领域技术人员已知的任何适当的低通滤波器。

在步骤S104中,可以对所获取的边缘信息和梯度信息进行预定的加强 处理,从而强化图像中与文本有关的边缘信息和梯度信息。

可以基于各种方法来对边缘信息和梯度信息进行加强处理。优选地,可 以通过二值化处理和整合处理来对边缘信息和梯度信息进行加强。此处的整 合处理可以为求交集处理、求最大值处理或求平均处理。优选地,整合处理 可以为求交集处理,这将稍后详细描述。

在步骤S106中,可以获得与经强化的边缘信息和梯度信息相对应的文 本笔划图像。

以下参照图2-图9来描述根据本发明实施例的通过利用索贝尔算子从图 像中提取文本笔划图像的方法。

图2是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本 笔划图像的方法的流程图,图3是示出待处理的原始图像,图4A-图4H是 示出用索贝尔算子卷积后得到的图像,图5A-图5D是示出通过对图像向相 对方向偏移并合成偏移后的图像所得到的四张图像,图6A-图6D是示出通 过对图像向相反方向偏移并合成偏移后的图像所得到的四张图像,图7是示 出整合后所得到的细笔划图像,图8是示出整合后所得到的粗笔划图像,以 及图9是示出通过过滤处理得到的粗笔划图像。

如图2所示,在步骤S202中,可以对要处理的图像(如图3所示的原 始图像)进行平滑(例如,低通滤波)。步骤S202为可选步骤。换句话说, 在图像比较清晰的情况下或者根据需要,可以不对如图3所示的图像进行平 滑(例如,低通滤波)。

此处,图3所示的原始图像作为要处理的图像。在图3中,希望提取出 的文本笔划包括:图像右上角处的FUJITSU以及图像正下方的日文字。其 中,FUJITSU是细笔划文字,日文字是粗笔划文字。要注意,图3仅是示例。 实际上,在一些图像中可能仅包含细笔划文字或粗笔划文字。

在步骤S204中,可以利用索贝尔(Sobel)算子与平滑后的图像卷积。 在不进行步骤S202的平滑处理的情况下,可以直接利用索贝尔算子与要处 理的图像(如图3所示的原始图像)卷积。

具体地,利用索贝尔算子对所处理图像在多个方向上进行卷积。换句话 说,利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算 子卷积核分别与图像的图像数据进行卷积计算。

例如,利用索贝尔算子对对所处理图像在四个方向上进行卷积。优选地, 这四个方向包括水平方向、垂直方向以及两个对角方向。卷积后的图像如图 4A-4H所示。选择这四个方向的原因在于,这四个方向与常见笔划“一”“丨” “丿”“乀”分别对应。

例如,所利用的索贝尔算子卷积核为:

其中,Sh为与水平方向关联的索贝尔算子卷积核,Sv为与垂直方向关联 的索贝尔算子卷积核,Srd为与第一对角方向关联的索贝尔算子卷积核,Sld为与第二对角方向关联的索贝尔算子卷积核。第一对角方向为从右上角到左 下角的对角线方向,第二对角方向为从左上角到右下角的对角线方向。

在这里,由于卷积的结果有正有负,因此可以利用两层图像来存储卷积 结果。一层用来存正脉冲响应图像,另外一层用来存负脉冲响应图像。换句 话说,将针对各个方向的卷积计算的结果划分为针对各个方向的正脉冲响应 图像数据和负脉冲响应图像数据。

在本文中仅给出四个方向的例子,但这不是说只可以在四个方向上进行 卷积计算。在需要高精度的情况下或者根据其他需要,可以利用更多方向的 索贝尔算子卷积核所处理图像进行卷积,例如8个方向。更多方向的卷积计 算可以带来更精确的结果。索贝尔算子的定义以及与图像数据进行卷积处理 可基于任何合适的现有技术。

通过对如图3所示的原始图像进行卷积,可以获得如图4A-图4H所示 的用索贝尔算子卷积核卷积后的图像。

具体地,图4A示出包含水平方向的正脉冲响应图像数据的图像,图4B 示出包含水平方向的负脉冲响应图像数据的图像。图4C示出包含垂直方向 的正脉冲响应图像数据的图像,图4D示出包含垂直方向的负脉冲响应图像 数据的图像。图4E示出包含从右上角到左下角的对角线方向的正脉冲响应 图像数据的图像,图4F示出包含从右上角到左下角的对角线方向的负脉冲 响应图像数据的图像。图4G示出包含从左上角到右下角的对角线方向的正 脉冲响应图像数据的图像,图4H示出包含从左上角到右下角的对角线方向 的负脉冲响应图像数据的图像。

接下来,在步骤S206中,利用预先估计的笔划宽度将正脉冲响应图像 数据和负脉冲响应图像数据偏移并合成偏移后的图像,如图5A-5D以及图 6A-6D所示。

可以对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据 执行向相对方向移位并相加的计算,以获得针对各个方向的第一合成图像数 据。此外,可以对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像 数据执行向相反方向移位并相加的计算,以获得针对各个方向的第二合成图 像数据。

例如,向相对方向移位并相加的计算可以基于以下公式(1):

Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2,

Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2,

Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2,以及

Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2;

此外,向相反方向移位并相加的计算可以基于以下公式(2):

Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2,

Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,

Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,以及

Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2;

其中,x表示像素的横坐标,y表示像素的纵坐标,Ih(x,y)、Iv(x,y)、Ird(x, y)和Ild(x,y)分别表示针对像素的横向、纵向以及两个对角线方向这四个方向 的第一合成图像数据,其中,包含第一合成图像数据的图像如图5A-5D所示。

图5A示出包含数据Ih(x,y)的图像,图5B示出包含数据Iv(x,y)的图像, 图5C示出包含数据Ird(x,y)的图像,图5D示出包含数据Ild(x,y)的图像。

Ih’(x,y)、Iv’(x,y)和Ird’(x,y)、Ild’(x,y)分别表示针对像素的横向、纵向 以及两个对角线方向这四个方向的第二合成图像数据。其中,包含第二合成 图像数据的图像如图6A-6D所示。

图6A示出包含数据Ih’(x,y)的图像,图6B示出包含数据Iv’(x,y)的图像, 图6C示出包含数据Ird’(x,y)的图像,图6D示出包含数据Ild’(x,y)的图像。

Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)和Ild-positive(x,y)分别表示针对像 素的横向、纵向以及两个对角线方向这四个方向的正脉冲响应图像数据。其 中,包含正脉冲相应图像数据的图像如图4A、4C、4E和4G所示。

Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)和Ild-negative(x,y)分别表示针对 像素的横向、纵向以及两个对角线方向这四个方向的负脉冲响应图像数据。 其中,包含负脉冲相应图像数据的图像如图4B、4D、4F和4H所示。

上述处理中涉及的w为预先估计的笔划宽度。例如,可以根据经验来估 计w的值,或者可以通过对图像进行目测来估计w的值。此外,上述公式1 和2只是给出了针对像素的横向、纵向以及两个对角线方向这四个方向的图 像数据进行合成处理的一个具体例子,而并不构成对本发明的限制。实际上, 任何用于加强笔划的合适的合成处理都是适用的。

应理解,进行向相对方向移位以及向相反方向移位的原因在于,对于一 个非特定图像不一定容易确定哪个方向的移位可以达到对笔划加强的效果。 为此,通过尝试性地分别进行向相对方向移位以及向相反方向移位总是可以 达到笔划加强的效果。如果可以事先确定哪个方向的移位可以达到对笔划加 强的效果,则不一定同时执行向相对方向移位以及向相反方向移位,即,只 需要向相对方向移位和向相反方向移位之一。在本文所给出的图像示例中, 向相对方向的移位可以达到对笔划加强的效果,如图5A-5D所示。向相反方 向的移位不能达到对笔划加强的效果,如图6A-6D所示。

在步骤S208中,可以对在步骤S206中合成后的图像进行高阈值的二值 化处理和整合处理。

例如,可以利用预先设定的高阈值分别对针对各个方向的第一合成图像 数据和第二合成图像数据进行高阈值的二值化处理。对经过高阈值的二值化 处理的针对各个方向的第一合成图像数据进行整合处理,并对经过高阈值的 二值化处理的针对各个方向的第二合成图像数据进行整合处理。

此处的整合处理可以为求交集处理、求最大值处理或求平均处理之一。

如果整合处理为求交集处理,则可以通过如下公式来进行求交集处理:

Ioutput-thin=Ih-binarized-highUIv-binarized-highUIrd-binarized-highUIld-binarized-high

I’output-thin=I’h-binarized-highUI’v-binarized-highUI’rd-binarized-highUI’ld-binarized-high

其中,Ioutput-thin为求交集后的第一细笔划图像数据,Ih-binarized-high、 Iv-binarized-high、Ird-binarized-high和Ild-binarized-high分别为对第一合成图像数据Ih(x,y)、 Iv(x,y)、Ird(x,y)和Ild(x,y)进行高阈值的二值化后得到的二值化图像数据。其 中,I’output-thin为求交集后的第二细笔划图像数据,I’h-binarized-high、I’v-binarized-high、 I’rd-binarized-high和I’ld-binarized-high分别为对第二合成图像数据Ih’(x,y)、Iv’(x,y)、 Ird’(x,y)和Ild’(x,y)进行高阈值的二值化后得到的二值化图像数据。

在步骤S210,可以获得细笔划图像数据。即,获得Ioutput-thin和I’output-thin

在步骤S212中,可以对合成后的图像进行低阈值的二值化处理和整合 处理。

例如,可以利用预先设定的小于上述高阈值的低阈值分别对针对各个方 向的第一合成图像数据和第二合成图像数据进行低阈值的二值化处理。对经 过低阈值的二值化处理的针对各个方向的第一合成图像数据进行整合处理, 并对经过第二二值化处理的针对各个方向的第二合成图像数据进行整合处 理。

此处的整合处理可以为求交集处理、求最大值处理或求平均处理之一。

如果整合处理为求交集处理。例如,可以通过如下公式来进行求交集处 理:

Ioutput-thick=Ih-binarized-lowUIv-binarized-lowUIrd-binarized-lowUIld-binarized-low

I’output-thick=I’h-binarized-lowUI’v-binarized-lowUI’rd-binarized-low U I’ld-binarized-low

其中,Ioutput-thick为求交集后的第一粗笔划图像数据,Ih-binarized-low、 Iv-binarized-low、Ird-binarized-low和Ild-binarized-low分别为对第一合成图像数据Ih(x,y)、 Iv(x,y)、Ird(x,y)和Ild(x,y)进行低阈值的二值化后得到的二值化图像数据。其 中,I’output-thick为求交集后的第二粗笔划图像数据,I’h-binarized-low、I’v-binarized-low、 I’rd-binarized-low和I’ld-binarized-low分别为对第二合成图像数据Ih’(x,y)、Iv’(x,y)、 Ird’(x,y)和Ild’(x,y)进行低阈值的二值化后得到的二值化图像数据。

容易理解,正如上述的,如果可以事先确定哪个方向的移位可以达到对 笔划加强的效果,则不一定同时执行向相对方向移位以及向相反方向移位, 以便得到第一合成图像数据和第二合成图像数据。也即,只需要在可以达到 对笔划加强的效果的方向上(例如相对方向或者相反方向)进行移位并得到 相应的合成图像数据,相应地,上述的二值化处理和整合处理也只需要针对 该合成图像数据执行即可。

在步骤S214,可选地,根据预定的过滤条件对在步骤S212中处理后的 数据进行过滤。

具体地,利用预定过滤条件分别对第一粗笔划图像数据和第二粗笔划图 像数据中的与连通域相关的数据进行过滤处理,以获得满足预定过滤条件的 第一连通域图像数据和第二连通域图像数据。

在此处利用预定过滤条件对第一粗笔划图像数据和第二粗笔划图像数 据进行过滤处理的原因在于,在步骤S212中获得的第一粗笔划图像数据和 第二粗笔划图像数据除了包含粗笔划之外,还可能包含其他物体的边缘数 据,例如,图像中的人体边缘数据或其他类似于粗笔划的边缘数据。通过利 用预定过滤条件对第一粗笔划图像数据和第二粗笔划图像数据进行过滤处 理,可以更加准确地获得与粗笔划对应的连通域图像数据。

其中,预定过滤条件可以是以下条件之一:(1)连通域内的像素的灰度 方差小于预定方差阈值,(2)连通域的内边缘到外边缘的像素极性一致,以 及(3)连通域的大小在预定大小阈值内;或者过滤条件可以是上述(1)、(2) 和(3)中两项或多项的任意结合。

这里,连通域是指由通过步骤S212的处理获得的粗笔划图像数据所代 表的边缘所构成的封闭区域。

对于过滤条件(1),即,连通域内的像素的灰度方差小于预定方差阈值, 具体地,首先,可以在步骤S212中处理过的图像中找到与连通域相关的坐 标信息。然后,基于坐标信息并基于如图3所示的原始图像,来确定连通域 的灰度方差,并判断该连通域内的灰度方差是否小于预定方差阈值。在连通 域内的灰度方差小于预定方差阈值的情况下,保留该连通域,即,认为该连 通域与粗笔划关联。否则,过滤掉该连通域。

对于过滤条件(2),即,连通域的内边缘到外边缘的像素极性一致,具 体地,首先,可以在步骤S212中处理过的图像中找到与连通域相关的坐标 信息。然后,基于坐标信息并基于如图3所示的原始图像,来确定连通域的 内边缘到外边缘的像素极性是否一致。在连通域内的内边缘和外边缘的像素 极性一致的情况下,保留该连通域,即,认为该连通域与粗笔划关联。否则, 过滤掉该连通域。

这里所说的像素的极性可以理解为一个内边缘像素的灰度和与该内边 缘像素相邻的外边缘像素的灰度之间的关系。例如,二值化图像中像素的灰 度被设置为是“0”或“255”,则如果两个像素的灰度值都为“0”或者都为 “255”,认为这两个像素的极性一致,反之则认为极性不一致。当然,也可 以根据实际需要来设定像素极性为一致的其他合适条件,在此不再赘述。

对于过滤条件(3),即,连通域的大小在预定大小阈值内,具体地,如 果连通域的大小在预定阈值内,则保留该连通域,即,认为该连通域与粗笔 划关联。否则,过滤掉该连通域。容易理解,粗笔划图像虽然相对于细笔划 图像要大,但是一般具有比较通用的上限,可以据此上限来设定上述的预定 阈值。如果连通域的尺寸过大,则可以认为该连通域所对应的不是粗笔划而 是非笔划对象,例如,在绝大多数情况下粗笔划尺寸不会占据整个图像的尺 寸的一半甚至更多。当然,在特殊情况下粗笔划尺寸的确很大,则只需要调 整上述的预定阈值的大小即可反映这种情况。

其中,上述的预定方差阈值和预定大小的阈值可以根据预先通过实验获 取的经验值来确定,或者可以根据对图像样本的目测来确定。当然,也可以 根据任何其他适当方法来确定。

也可以结合过滤条件(1)、(2)和(3)中的两项或全部的任意组合来 执行过滤。

接下来,在步骤S216中,获得分别与第一连通域图像数据和第二连通 域图像数据相对应的第一粗笔划边缘图像数据和第二粗笔划边缘图像数据。

在步骤S218中,获得分别与第一细笔划图像数据和第二细笔划图像数 据相对应的第一细笔划图像(如图7所示)和第二细笔划图像(未示出), 并获得分别与第一粗笔划边缘图像数据和第二粗笔划边缘图像数据相对应 的第一粗笔划图像(如图9所示)和第二粗笔划图像(未示出)。

应理解,在不执行步骤S214的情况下,也可以得到粗笔划图像。换句 话说,可以基于步骤S212获得的Ioutput-thick和I’output-thick来得到第一粗笔划图 像(如图8所示)和第二粗笔划图像。

在本文中,尽管通过上述步骤可以得到第二细笔划图像和第二粗笔划图 像,但由于向相反方向的移位不能达到对笔划加强的效果,因此没有具体示 出相应得到的第二细笔划图像、第二粗笔划图像。

可选地,可以基于文本笔划的精度、文本笔划的召回率、或者文本笔划 的精度和文本笔划的召回率的折中,来筛选第一细笔划图像和第二细笔划图 像中的一个作为最终的细笔划图像。也可以基于文本笔划的精度、文本笔划 的召回率、或者文本笔划的精度和文本笔划的召回率的折中,来筛选第一粗 笔划图像和第二粗笔划图像中的一个作为最终的粗笔划图像。在本文的示例 中,由于相对方向的移位可以达到对笔划加强的效果,因此,基于文本笔划 的精度、文本笔划的召回率、或者文本笔划的精度和文本笔划的召回率的折 中,可以得到第一细笔划图像和第一粗笔划图像作为最终的笔划提取结果。

本文中所提到的文本笔划的精度可以理解为实际检测到的正确笔划的 数量与实际检测到的笔划的数量之比,文本笔划的召回率可以理解为实际检 测的正确笔划的数量与实际存在的正确笔划的数量之比。

上述以索贝尔算子为例描述了从图像中提取文本笔划图像的方法。但这 仅是以示例的方式描述从图像中提取文本笔划图像的方法。可以使用的算子 不局限于此,而可以是Robert算子、Prewitt算子、Laplace算子、log算子、 Canny算子或者其他任意的适当算子。

此外,尽管在步骤S208和S212中描述了先进行二值化处理再进行整合 处理,但实际上也可以先进行整合处理再进行二值化处理。

上述提到的高阈值和低阈值可以根据经验来确定,或者通过若干次的试 验来确定。但这仅是示例,可以通过任意适当的方法来确定高阈值和低阈值。

以下参照图10来描述根据本发明实施例的用于从图像中提取文本笔划 图像的装置400。

图10是示出根据本发明实施例的用于从图像中提取文本笔划图像的装 置400的框图。装置400例如可以执行上述参照图1描述的用于从图像中提 取文本笔划图像的方法。

具体地,装置400包括:信息获取单元402,可以用于获取所述图像的 边缘信息和梯度信息;强化单元404,可以用于对所获取的边缘信息和梯度 信息进行预定的加强处理,从而强化所述图像中与文本有关的边缘信息和梯 度信息;以及笔划图像获得单元406,可以用于获得与经强化的边缘信息和 梯度信息相对应的文本笔划图像。

可选地,装置400可以包括筛选单元(未示出)。筛选单元可以被配置 为对所提取出的多个文本笔划图像进行筛选。

信息获取单元402可以被配置为对代表图像的边缘信息和梯度信息的阶 跃信号或脉冲信号进行分析,根据分析结果来提取边缘信息和梯度信息。

在图像中,细笔划的图像数据可以呈现为脉冲信号,粗笔划的图像数据 和类似于粗笔划的大尺度对象可以呈现为阶跃信号。可以对脉冲信号进行分 析,并根据其分析结果来提取细笔划的边缘信息和梯度信息。此外,可以对 阶跃信号进行分析,并根据其分析结果来提取粗笔划的边缘信息和梯度信 息,并提取类似于粗笔划的大尺度对象的边缘信息和梯度信息。

可选地,装置400还可以包括降噪单元(未示出)。降噪单元可以被配 置为根据图像的清晰程度或在需要的情况下,对原始图像进行滤波以降噪。 例如,可以利用低通滤波器对图像进行滤波,以抑制原始图像中的噪声。低 通滤波器例如可以是高斯滤波器,但是低通滤波器不限于此,而可以是本领 域技术人员已知的任何适当的低通滤波器。

强化单元404也可以被配置为基于各种方法来对边缘信息和梯度信息进 行加强处理。优选地,可以通过二值化处理和整合处理来对边缘信息和梯度 信息进行加强。此处的整合处理可以为求交集处理、求最大值处理或求平均 处理之一。优选地,整合处理可以为求交集处理,这将稍后详细描述。

以下参照图11来描述根据本发明实施例的通过利用索贝尔算子从图像 中提取文本笔划图像的装置400’。

图11是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文 本笔划图像的装置400’的框图。

装置400’可以执行以上参照图2-图9描述的根据本发明实施例的通过利 用索贝尔算子从图像中提取文本笔划图像的方法。

具体地,类似于装置400,装置400’包括信息获取单元402’、强化单元 404’、以及笔划图像获得单元406’。可选地,装置400’也可以包括筛选单元 和降噪单元(均未示出)。

筛选单元可以被配置为基于文本笔划的精度和文本笔划的召回率中的 至少一个,筛选所述第一细笔划图像和所述第二细笔划图像中的一个作为最 终的细笔划图像和/或筛选所述第一粗笔划图像和所述第二粗笔划图像中的 一个作为最终的粗笔划图像。具体的筛选处理已参照图2-图9进行描述,在 此不再重复。

降噪单元可以被配置为对原始图像(即要处理的图像)进行滤波以降噪。 具体的降噪处理已参照图2-图9进行描述,在此不再重复。

其中,信息获取单元402’可以包括卷积运算子单元4022和划分子单元 4024。卷积运算子单元4022被配置为利用用于获取图像在多个方向上的边 缘信息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据进 行卷积计算。划分子单元4024被配置为将针对各个方向的卷积计算的结果 划分为针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据。

强化单元404’可以包括第一合成图像获得子单元4042和/或第二合成图 像获得子单元4044。第一合成图像获得子单元4042可以被配置为对于针对 各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相对方向移 位并相加的计算,以获得针对各个方向的第一合成图像数据。第二合成图像 获得子单元4044可以被配置为对于针对各个方向的正脉冲响应图像数据和 负脉冲响应图像数据执行向相反方向移位并相加的计算,以获得针对各个方 向的第二合成图像数据。

所述笔划图像获得单元406’可以包括:第一二值化处理子单元4062、第 一细笔划图像获得子单元4064、第二细笔划图像获得子单元4066、第二二 值化处理子单元4068、第一粗笔划图像获得子单元40610和第二粗笔划图像 获得子单元40612。

第一二值化处理子单元4062可以被配置为利用预先设定的第一阈值分 别对针对各个方向的第一合成图像数据和第二合成图像数据进行第一二值 化处理。

第一细笔划图像获得子单元4064可以被配置为对经过第一二值化处理 的针对各个方向的第一合成图像数据进行整合处理以获得第一细笔划图像 数据,从而获得与所述第一细笔划图像数据相对应的第一细笔划图像。

第二细笔划图像获得子单元4066可以被配置为对经过第一二值化处理 的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二细笔 划图像数据,从而获得与第二细笔划图像数据相对应的第二细笔划图像。

第二二值化处理子单元4068可以被配置为利用预先设定的小于第一阈 值的第二阈值分别对针对各个方向的第一合成图像数据和第二合成图像数 据进行第二二值化处理。

第一粗笔划图像获得子单元40610可以被配置为对经过第二二值化处理 的针对各个方向的第一合成图像数据进行整合处理以获得第一粗笔划边缘 图像数据,从而获得与所述第一粗笔划边缘图像数据相对应的第一粗笔划图 像。

第二粗笔划图像获得子单元40612可以被配置为对经过第二二值化处理 的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二粗笔 划边缘图像数据,从而获得与所述第二粗笔划边缘图像数据相对应的第二粗 笔划图像。

根据需要,笔划图像获得单元406可以只包括第一二值化处理子单元 4062、第一细笔划图像获得子单元4064和第二细笔划图像获得子单元4066, 或者只包括第二二值化处理子单元4068、第一粗笔划图像获得子单元40610 和第二粗笔划图像获得子单元40612。换句话说,根据需要,笔划图像获得 单元406可以被配置为只获得细笔划图像或者只获得粗笔划图像,例如在待 处理图像只存在粗笔划或者细笔划的文本信息,或者只需要提取粗笔划或者 细笔划的文本信息的情形。

而且,如上述所述,如果可以事先确定哪个方向的移位可以达到对笔划 加强的效果,则强化单元404’可以包括第一合成图像获得子单元4042和第 二合成图像获得子单元4044中与该方向上的处理对应的合成图像获得子单 元之一,相应地,笔划图像获得单元406’可以只包括与该方向上的处理对应 的第一细笔划图像获得子单元4064和第二细笔划图像获得子单元4066中之 一,以及包括与该方向上的处理对应的第一粗笔划图像获得子单元40610和 第二粗笔划图像获得子单元40612中之一。

装置400’例如可以被配置成执行以上参照图2-图9描述的根据本发明实 施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法。为了简明, 在此不再具体描述第一二值化处理子单元4062、第一细笔划图像获得子单元 4064、第二细笔划图像获得子单元4066、第二二值化处理子单元4068、第 一粗笔划图像获得子单元40610和第二粗笔划图像获得子单元40612的具体 处理过程。

此外,可选地,笔划图像获得单元406’还可以包括过滤子单元(未示出)。 过滤子单元可以被配置为利用预定过滤条件分别对第一粗笔划边缘图像数 据和第二粗笔划边缘图像数据中的与连通域相关的数据进行过滤处理,以获 得满足预定过滤条件的第一连通域图像数据和第二连通域图像数据。

预定过滤条件包括以下条件中的至少之一:所述连通域内的像素的灰度 方差小于预定方差阈值;所述连通域的内边缘到外边缘的像素极性一致;以 及所述连通域的大小在预定大小阈值内。关于预定过滤条件已参照图2-图9 进行描述,在此不再重复。

通过根据本发明实施例的用于从图像中提取文本笔划图像的方法和装 置可以实现以下技术效果中的至少之一:速度快、提取笔画的同时可以抑制 噪声、对笔画尺度不敏感、由于所处理视频的质量较差。此外,根据本发明 实施例的用于从图像中提取文本笔划图像的方法和装置对文本的颜色、文本 背景对比度等先验知识没有要求。

以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是, 对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任 何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计 算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领 域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能 就能实现的。

因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一 组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的 也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来 实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产 品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介 质或者将来所开发出来的任何存储介质。

在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络 向具有专用硬件结构的计算机,例如图12所示的通用计算机1200安装构成 该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。

在图12中,中央处理单元(CPU)1201根据只读存储器(ROM)1202中存 储的程序或从存储部分1208加载到随机存取存储器(RAM)1203的程序执行 各种处理。在RAM 1203中,也根据需要存储当CPU 1201执行各种处理等 等时所需的数据。CPU 1201、ROM 1202和RAM 1203经由总线1204彼此 链路。输入/输出接口1205也链路到总线1204。

下述部件链路到输入/输出接口1205:输入部分1206(包括键盘、鼠标 等等)、输出部分1207(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD) 等,和扬声器等)、存储部分1208(包括硬盘等)、通信部分1209(包括网 络接口卡比如LAN卡、调制解调器等)。通信部分1209经由网络比如因特 网执行通信处理。根据需要,驱动器1210也可链路到输入/输出接口1205。 可拆卸介质1211比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被 安装在驱动器1210上,使得从中读出的计算机程序根据需要被安装到存储 部分1208中。

在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质 比如可拆卸介质1211安装构成软件的程序。

本领域的技术人员应当理解,这种存储介质不局限于图12所示的其中 存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1211。可 拆卸介质1211的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存 储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标)) 和半导体存储器。或者,存储介质可以是ROM 1202、存储部分1208中包含 的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。

本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码 由机器读取并执行时,可执行上述根据本发明实施例的方法。

相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储 介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、 存储卡、存储棒等。

本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不 局限于此。

在本说明书中,“第一”、“第二”以及“第N个”等表述是为了将所描 述的特征在文字上区分开,以清楚地描述本发明。因此,不应将其视为具有 任何限定性的含义。

作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/ 或单元可以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。 上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行 配置时可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。

作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网 络向具有专用硬件结构的计算机(例如图12所示的通用计算机1200)安装 构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。

在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出 的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其 他实施方式中的特征相组合,或替代其他实施方式中的特征。

应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的 存在,但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。

此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可 以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的 方法的执行顺序不对本发明的技术范围构成限制。

关于包括以上实施例的实施方式,还公开下述附记:

附记

附记1.一种用于从图像中提取文本笔划图像的方法,包括:

获取所述图像的边缘信息和梯度信息;

对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化所述 图像中与文本有关的边缘信息和梯度信息;以及

获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

附记2.根据附记1所述的方法,其中,所述获取所述图像的边缘信 息和梯度信息的步骤包括:

对代表所述图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行 分析,根据分析结果来提取所述边缘信息和所述梯度信息。

附记3.根据附记2所述的方法,其中:

所述获取所述图像的边缘信息和梯度信息的步骤包括:

利用用于获取图像在多个方向上的边缘信息和梯度信息的多个 索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算,以及

将针对各个方向的卷积计算的结果划分为针对各个方向的正脉 冲响应图像数据和负脉冲响应图像数据;

所述强化所述图像中与文本有关的边缘信息和梯度信息的步骤包括:

对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数 据执行向相对方向移位并相加的计算,以获得针对各个方向的第一合 成图像数据,和/或

对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数 据执行向相反方向移位并相加的计算,以获得针对各个方向的第二合 成图像数据;

所述获得与经强化的边缘信息和梯度信息相对应的文本笔划图像的 步骤包括:

利用预先设定的第一阈值分别对针对各个方向的第一合成图像 数据和/或第二合成图像数据进行第一二值化处理,对经过第一二值 化处理的针对各个方向的第一合成图像数据进行整合处理以获得第 一细笔划图像数据,从而获得与所述第一细笔划图像数据相对应的第 一细笔划图像,和/或对经过第一二值化处理的针对各个方向的第二 合成图像数据进行整合处理以获得对应的第二细笔划图像数据,从而 获得与所述第二细笔划图像数据相对应的第二细笔划图像;和/或

利用预先设定的小于第一阈值的第二阈值分别对针对各个方向 的第一合成图像数据和/或第二合成图像数据进行第二二值化处理, 对经过第二二值化处理的针对各个方向的第一合成图像数据进行整 合处理以获得第一粗笔划边缘图像数据,从而获得与所述第一粗笔划 边缘图像数据相对应的第一粗笔划图像,和/或对经过第二二值化处 理的针对各个方向的第二合成图像数据进行整合处理以获得对应的 第二粗笔划边缘图像数据,从而获得与所述第二粗笔划边缘图像数据 相对应的第二粗笔划图像。

附记4.根据附记3所述的方法,其中,所述整合处理包括求交集处 理、求最大值处理和求平均处理之一。

附记5.根据附记3或4所述的方法,其中,在所述利用用于获取图 像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与 所述图像的图像数据进行卷积计算的步骤包括:

利用用于获取图像的横向、纵向以及两个对角线方向这四个方向上的 边缘信息和梯度信息的四个索贝尔算子卷积核分别与所述图像的图像数 据进行卷积计算。

附记6.根据附记3至5中任一项所述的方法,其中,所述向相对方 向移位并相加的计算基于以下公式:

Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2,

Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2,

Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2,以及

Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2;

并且其中,所述向相反方向移位并相加的计算基于以下公式:

Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2,

Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,

Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,以及

Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2;

其中,x表示像素的横坐标,y表示所述像素的纵坐标,Ih(x,y)、Iv(x, y)、Ird(x,y)和Ild(x,y)分别表示针对所述像素的横向、纵向以及两个对角线 方向这四个方向的第一合成图像数据,

Ih’(x,y)、Ir’(x,y)和Ird’(x,y)、Ild’(x,y)分别表示针对所述像素的横向、纵 向以及两个对角线方向这四个方向的第二合成图像数据,

Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)和Ild-positive(x,y)分别表示针对所述像素 的横向、纵向以及两个对角线方向这四个方向的正脉冲响应图像数据,以 及

Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)和Ild-negative(x,y)分别表示针对所述像 素的横向、纵向以及两个对角线方向这四个方向的负脉冲响应图像数据, w为预先估计的笔划宽度。

附记7.根据附记3至6中任一项所述的方法,其中,所述获得分别 与所述第一粗笔划边缘图像数据和所述第二粗笔划边缘图像数据相对应 的第一粗笔划图像和第二粗笔划图像的步骤包括:

利用预定过滤条件分别对所述第一粗笔划边缘图像数据和所述第二 粗笔划边缘图像数据中的连通域数据进行过滤处理,以获得满足所述预定 过滤条件的第一连通域图像数据和第二连通域图像数据;以及

获得分别与所述第一连通域图像数据和所述第二连通域图像数据相 对应的第一粗笔划图像和第二粗笔划图像。

附记8.根据附记7所述的方法,其中,所述预定过滤条件包括以下 条件中的至少之一:

所述连通域内的像素的灰度方差小于预定方差阈值;

所述连通域的内边缘到外边缘的像素极性一致;以及

所述连通域的大小在预定大小阈值内。

附记9.根据附记3至8中任一项所述的方法,还包括:

基于文本笔划的精度和文本笔划的召回率中的至少一个,筛选所述第 一细笔划图像和所述第二细笔划图像中的一个作为最终的细笔划图像和/ 或筛选所述第一粗笔划图像和所述第二粗笔划图像中的一个作为最终的 粗笔划图像。

附记10.一种用于从图像中提取文本笔划图像的装置,包括:

信息获取单元,用于获取所述图像的边缘信息和梯度信息;

强化单元,用于对所获取的边缘信息和梯度信息进行预定的加强处 理,从而强化所述图像中与文本有关的边缘信息和梯度信息;以及

笔划图像获得单元,用于获得与经强化的边缘信息和梯度信息相对应 的文本笔划图像。

附记11.根据附记10所述的装置,其中,所述信息获取单元被配置 为对代表所述图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分 析,根据分析结果来提取所述边缘信息和所述梯度信息。

附记12.根据附记11所述的装置,其中:

所述信息获取单元包括:

卷积运算子单元,用于利用用于获取图像在多个方向上的边缘信 息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据 进行卷积计算,以及

划分子单元,用于将针对各个方向的卷积计算的结果划分为针对 各个方向的正脉冲响应图像数据和负脉冲响应图像数据;

所述强化单元包括:

第一合成图像获得子单元,用于对于针对各个方向的正脉冲响应 图像数据和负脉冲响应图像数据执行向相对方向移位并相加的计算, 以获得针对各个方向的第一合成图像数据,和/或

第二合成图像获得子单元,用于对于针对各个方向的正脉冲响应 图像数据和负脉冲响应图像数据执行向相反方向移位并相加的计算, 以获得针对各个方向的第二合成图像数据;

所述笔划图像获得单元包括:

第一二值化处理子单元,用于利用预先设定的第一阈值分别对针 对各个方向的第一合成图像数据和/或第二合成图像数据进行第一二 值化处理;第一细笔划图像获得子单元,用于对经过第一二值化处理 的针对各个方向的第一合成图像数据进行整合处理以获得第一细笔 划图像数据,从而获得与所述第一细笔划图像数据相对应的第一细笔 划图像;和/或第二细笔划图像获得子单元,用于对经过第一二值化 处理的针对各个方向的第二合成图像数据进行整合处理以获得对应 的第二细笔划图像数据,从而获得与第二细笔划图像数据相对应的第 二细笔划图像;和/或

第二二值化处理子单元,用于利用预先设定的小于第一阈值的第 二阈值分别对针对各个方向的第一合成图像数据和/或第二合成图像 数据进行第二二值化处理;第一粗笔划图像获得子单元,用于对经过 第二二值化处理的针对各个方向的第一合成图像数据进行整合处理 以获得第一粗笔划边缘图像数据,从而获得与所述第一粗笔划边缘图 像数据相对应的第一粗笔划图像;和/或第二粗笔划图像获得子单元, 用于对经过第二二值化处理的针对各个方向的第二合成图像数据进 行整合处理以获得对应的第二粗笔划边缘图像数据,从而获得与所述 第二粗笔划边缘图像数据相对应的第二粗笔划图像。

附记13.根据附记12所述的装置,其中,所述整合处理包括求交集 处理、求最大值处理和求平均处理之一。

附记14.根据附记12或13所述的装置,其中,所述卷积运算子单元 被配置为利用用于获取图像的横向、纵向以及两个对角线方向这四个方向 上的边缘信息和梯度信息的四个索贝尔算子卷积核分别与所述图像的图 像数据进行卷积计算。

附记15.根据附记12至14中任一项所述的装置,其中,所述向相 对方向移位并相加的计算基于以下公式:

Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2,

Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2,

Ird(x,y)=(Itd-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2,以及

Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2;

并且其中,所述向相反方向移位并相加的计算基于以下公式:

Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2,

Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,

Ird’(x,y)=(Ird-positve(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,以及

Ild’(x,y)=(Ild-postive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2;

其中,x表示像素的横坐标,y表示所述像素的纵坐标,Ih(x,y)、Iv(x, y)、Ird(x,y)和Ild(x,y)分别表示针对所述像素的横向、纵向以及两个对角线 方向这四个方向的第一合成图像数据,

Ih’(x,y)、Iv’(x,y)和Ird’(x,y)、Ild’(x,y)分别表示针对所述像素的横向、纵 向以及两个对角线方向这四个方向的第二合成图像数据,

Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)和Ild-positive(x,y)分别表示针对所述像素 的横向、纵向以及两个对角线方向这四个方向的正脉冲响应图像数据,以 及

Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)和Ild-negative(x,y)分别表示针对所述像 素的横向、纵向以及两个对角线方向这四个方向的负脉冲响应图像数据, w为预先估计的笔划宽度。

附记16.根据附记12至15中任一项所述的装置,其中,所述笔划图 像获得单元还包括:

过滤子单元,用于利用预定过滤条件分别对所述第一粗笔划边缘图像 数据和所述第二粗笔划边缘图像数据中的连通域数据进行过滤处理,以获 得满足所述预定过滤条件的第一连通域图像数据和第二连通域图像数据。

附记17.根据附记16所述的装置,其中,所述预定过滤条件包括以 下条件中的至少之一:

所述连通域内的像素的灰度方差小于预定方差阈值;

所述连通域的内边缘到外边缘的像素极性一致;以及

所述连通域的大小在预定大小阈值内。

附记18.根据附记12至17中任一项所述的装置,还包括:

筛选单元,用于基于文本笔划的精度和文本笔划的召回率中的至少一 个,筛选所述第一细笔划图像和所述第二细笔划图像中的一个作为最终的 细笔划图像和/或筛选所述第一粗笔划图像和所述第二粗笔划图像中的一 个作为最终的粗笔划图像。

附记19.一种存储有机器可读取的指令代码的程序产品,所述指令代 码由机器读取并执行时,可执行如附记1-9中任一项所述的用于从图像中 提取文本笔划图像的方法。

附记20.一种承载有如附记19所述的程序产品的存储介质。

尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露, 但是,应该理解,本领域的技术人员可在所附权利要求的精神和范围内设计 对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当 被认为包括在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号