首页> 中国专利> 用于从图像中提取文本笔划图像的方法和装置

用于从图像中提取文本笔划图像的方法和装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种用于从图像中提取文本笔划图像的方法和装置。根据本发明的一个方面，提供了一种用于从图像中提取文本笔划图像的方法，包括：获取图像的边缘信息和梯度信息；对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化图像中与文本有关的边缘信息和梯度信息；以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

著录项

公开/公告号CN102810155A

专利类型发明专利
公开/公告日2012-12-05

原文格式PDF
申请/专利权人富士通株式会社;
展开▼

申请/专利号CN201110157673.4
发明设计人桂天宜;皆川明洋;胜山裕;孙俊;堀田悦伸;直井聪;
展开▼

申请日2011-05-31
分类号G06K9/00(20060101);G06K9/20(20060101);G06T7/00(20060101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人王萍;王娜丽
地址日本神奈川县
入库时间 2023-12-18 07:36:17

法律信息

法律状态公告日

法律状态信息

法律状态
2015-04-15

授权

授权
2013-01-30

实质审查的生效 IPC(主分类):G06K9/00 申请日:20110531

实质审查的生效
2012-12-05

公开

公开

说明书

技术领域

本发明涉及图像处理领域，更具体地涉及用于从图像中提取文本笔划图像的方法和装置。

背景技术

在当今的信息处理领域中存在大量的视频文件。存在对这些视频文件进行有效地检索的需要。对于视频标注、视频搜索等，视频中的文本信息是准确又简单的线索。因此，如何准确地提取并且识别视频中所包含的文本信息，对后续的视频标注、视频检索非常重要。

已知的一些提取文笔笔划的技术，存在速度慢、噪声大、对笔划尺度不敏感等缺点。

需要能够解决上述问题的用于从图像中提取文本笔划图像的方法和装置。

发明内容

在下文中给出关于本发明的简要概述，以便提供关于本发明的某些方面的基本理解。应当理解，这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分，也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。

本发明的目的在于，提供一种用于从图像中提取文本笔划图像的方法和装置。

根据本发明的一个方面，提供了一种用于从图像中提取文本笔划图像的方法，包括：获取图像的边缘信息和梯度信息；对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化图像中与文本有关的边缘信息和梯度信息；以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

根据本发明的另一个方面，提供了一种用于从图像中提取文本笔划图像的装置，包括：信息获取单元，用于获取图像的边缘信息和梯度信息；强化单元，用于对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化图像中与文本有关的边缘信息和梯度信息；以及笔划图像获得单元，用于获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

另外，本发明的实施例还提供了用于实现上述方法的计算机程序。

此外，本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品，其上记录有用于实现上述方法的计算机程序代码。

通过以下结合附图对本发明的最佳实施例的详细说明，本发明的这些以及其他优点将更加明显。

附图说明

参照下面结合附图对本发明实施例的说明，会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中，相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。

图1是示出根据本发明实施例的用于从图像中提取文本笔划图像的方法的流程图；

图1A是示意性地示出阶跃信号、脉冲信号、与索贝尔算子对应的信号、利用索贝尔算子提取阶跃信号的提取结果、利用索贝尔算子提取脉冲信号的提取结果、对阶跃信号的提取结果取绝对值后得到的信号、对脉冲信号的提取结果取绝对值后得到的信号、以及相应的经偏移的信号的示意图；

图2是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法的流程图；

图3是示出待处理的原始图像；

图4A-图4H是示出用索贝尔算子卷积后得到的图像；

图5A-图5D是示出通过对经索贝尔算子处理后的图像向相对方向偏移并合成偏移后的图像所得到的四张图像；

图6A-图6D是示出通过对经索贝尔算子处理后的图像向相反方向偏移并合成偏移后的图像所得到的四张图像；

图7是示出整合后所得到的细笔划图像；

图8是示出整合后所得到的粗笔划图像；

图9是示出通过过滤处理得到的粗笔划图像；

图10是示出根据本发明实施例的用于从图像中提取文本笔划图像的装置的框图；

图11是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的装置的框图；以及

图12示出了可以用于实施本发明的用于从图像中提取文本笔划图像的方法和装置的计算设备的举例的结构图。

具体实施方式

下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意，为了清楚的目的，附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。

以下参照图1来描述根据本发明实施例的用于从图像中提取文本笔划图像的方法。

图1是示出根据本发明实施例的用于从图像中提取文本笔划图像的方法的流程图。如图1所示，在步骤S102中，可以获取图像的边缘信息和梯度信息。

优选地，可以对代表图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分析，并根据分析结果来提取边缘信息和梯度信息。

在图像中，细笔划的图像数据可以呈现为脉冲信号，粗笔划的图像数据和类似于粗笔划的大尺度对象可以呈现为阶跃信号。可以对脉冲信号进行分析，并根据其分析结果来提取细笔划的边缘信息和梯度信息。此外，可以对阶跃信号进行分析，并根据其分析结果来提取粗笔划的边缘信息和梯度信息，并提取类似于粗笔划的大尺度对象的边缘信息和梯度信息。

以下参照图1A来描述利用索贝尔算子提取阶跃信号的过程和利用索贝尔算子提取脉冲信号的过程，以及通过偏移处理和合成处理执行加强处理的过程。

图i示出了阶跃信号，图ii示出脉冲信号，图iii和图iv示出与索贝尔算子对应的信号，图v示出利用索贝尔算子提取阶跃信号的提取结果，图vi 示出利用索贝尔算子提取脉冲信号的提取结果，图vii示出对阶跃信号的提取结果取绝对值后得到的信号，图viii示出对脉冲信号的提取结果取绝对值后得到的信号，以及图ix和图x相应的经偏移的信号的示意图。

应理解，图1A中的坐标及大小仅是示意性的而非限制性的，并且仅旨在示出相关信号处理的原理。

如图1A所示，通过利用索贝尔算子(如图iii所示)提取阶跃信号(如图i所示)，可以获得单一的谷状信号(如图v所示)，而通过利用索贝尔算子(如图iv所示)提取脉冲信号(如图ii所示)，可以获得谷状信号和峰状信号结合的信号(如图vi所示)。可见，通过利用索贝尔算子来提取阶跃信号和脉冲信号，可以相应获得差异较大的两种信号(如图v和图vi所示)。

然后，通过稍后描述的强化处理(例如，包括偏移处理和合成处理)可以强化阶跃信号和脉冲信号，从而提取与脉冲信号对应的细笔划的图像数据以及与阶跃信号对应的粗笔划的图像数据。

例如，可以对利用索贝尔算子提取出的脉冲信号中的谷状信号(如图vi 所示)取绝对值(即，取谷状信号的大小)，得到另一峰状信号(如图viii 所示)。然后将该另一峰状信号和原峰状信号部分(即，利用索贝尔算子提取到的峰状信号)向相对方向偏移，并将偏移后的该另一峰状信号和原峰状信号相叠加(如图x所示)，从而可以再次加强与该脉冲信号对应的细笔划的图像数据。此外，可以对利用索贝尔算子提取出的阶跃信号中的谷状信号 (如图v所示)取绝对值，得到又一峰状信号(如图vii所示)。然后偏移该又一峰状信号(如图ix所示)。

可选地，可以基于预定的过滤条件过滤掉类似于粗笔划的大尺度对象的边缘信息和梯度信息，而只留下粗笔划的边缘信息和梯度信息。具体的过滤处理将稍后描述。

可选地，可以根据图像的清晰程度或在需要的情况下，对如图3所示的原始图像进行滤波。例如，可以利用低通滤波器对原始图像进行滤波，以抑制图像中的噪声。低通滤波器例如可以是高斯滤波器，但是低通滤波器不限于此，而可以是本领域技术人员已知的任何适当的低通滤波器。

在步骤S104中，可以对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化图像中与文本有关的边缘信息和梯度信息。

可以基于各种方法来对边缘信息和梯度信息进行加强处理。优选地，可以通过二值化处理和整合处理来对边缘信息和梯度信息进行加强。此处的整合处理可以为求交集处理、求最大值处理或求平均处理。优选地，整合处理可以为求交集处理，这将稍后详细描述。

在步骤S106中，可以获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

以下参照图2-图9来描述根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法。

图2是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法的流程图，图3是示出待处理的原始图像，图4A-图4H是示出用索贝尔算子卷积后得到的图像，图5A-图5D是示出通过对图像向相对方向偏移并合成偏移后的图像所得到的四张图像，图6A-图6D是示出通过对图像向相反方向偏移并合成偏移后的图像所得到的四张图像，图7是示出整合后所得到的细笔划图像，图8是示出整合后所得到的粗笔划图像，以及图9是示出通过过滤处理得到的粗笔划图像。

如图2所示，在步骤S202中，可以对要处理的图像(如图3所示的原始图像)进行平滑(例如，低通滤波)。步骤S202为可选步骤。换句话说，在图像比较清晰的情况下或者根据需要，可以不对如图3所示的图像进行平滑(例如，低通滤波)。

此处，图3所示的原始图像作为要处理的图像。在图3中，希望提取出的文本笔划包括：图像右上角处的FUJITSU以及图像正下方的日文字。其中，FUJITSU是细笔划文字，日文字是粗笔划文字。要注意，图3仅是示例。实际上，在一些图像中可能仅包含细笔划文字或粗笔划文字。

在步骤S204中，可以利用索贝尔(Sobel)算子与平滑后的图像卷积。在不进行步骤S202的平滑处理的情况下，可以直接利用索贝尔算子与要处理的图像(如图3所示的原始图像)卷积。

具体地，利用索贝尔算子对所处理图像在多个方向上进行卷积。换句话说，利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与图像的图像数据进行卷积计算。

例如，利用索贝尔算子对对所处理图像在四个方向上进行卷积。优选地，这四个方向包括水平方向、垂直方向以及两个对角方向。卷积后的图像如图 4A-4H所示。选择这四个方向的原因在于，这四个方向与常见笔划“一”“丨” “丿”“乀”分别对应。

例如，所利用的索贝尔算子卷积核为：

其中，S_h为与水平方向关联的索贝尔算子卷积核，S_v为与垂直方向关联的索贝尔算子卷积核，S_rd为与第一对角方向关联的索贝尔算子卷积核，S_ld为与第二对角方向关联的索贝尔算子卷积核。第一对角方向为从右上角到左下角的对角线方向，第二对角方向为从左上角到右下角的对角线方向。

在这里，由于卷积的结果有正有负，因此可以利用两层图像来存储卷积结果。一层用来存正脉冲响应图像，另外一层用来存负脉冲响应图像。换句话说，将针对各个方向的卷积计算的结果划分为针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据。

在本文中仅给出四个方向的例子，但这不是说只可以在四个方向上进行卷积计算。在需要高精度的情况下或者根据其他需要，可以利用更多方向的索贝尔算子卷积核所处理图像进行卷积，例如8个方向。更多方向的卷积计算可以带来更精确的结果。索贝尔算子的定义以及与图像数据进行卷积处理可基于任何合适的现有技术。

通过对如图3所示的原始图像进行卷积，可以获得如图4A-图4H所示的用索贝尔算子卷积核卷积后的图像。

具体地，图4A示出包含水平方向的正脉冲响应图像数据的图像，图4B 示出包含水平方向的负脉冲响应图像数据的图像。图4C示出包含垂直方向的正脉冲响应图像数据的图像，图4D示出包含垂直方向的负脉冲响应图像数据的图像。图4E示出包含从右上角到左下角的对角线方向的正脉冲响应图像数据的图像，图4F示出包含从右上角到左下角的对角线方向的负脉冲响应图像数据的图像。图4G示出包含从左上角到右下角的对角线方向的正脉冲响应图像数据的图像，图4H示出包含从左上角到右下角的对角线方向的负脉冲响应图像数据的图像。

接下来，在步骤S206中，利用预先估计的笔划宽度将正脉冲响应图像数据和负脉冲响应图像数据偏移并合成偏移后的图像，如图5A-5D以及图 6A-6D所示。

可以对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相对方向移位并相加的计算，以获得针对各个方向的第一合成图像数据。此外，可以对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相反方向移位并相加的计算，以获得针对各个方向的第二合成图像数据。

例如，向相对方向移位并相加的计算可以基于以下公式(1)：

I_h(x，y)＝(I_h-positive(x，y-w/2)+I_h-negative(x，y+w/2))/2，

I_v(x，y)＝(I_v-positive(x-w/2，y)+I_v-negative(x+w/2，y))/2，

I_rd(x，y)＝(I_rd-positive(x+w/2，y-w/2)+I_rd-negative(x-w/2，y+w/2))/2，以及

I_ld(x，y)＝(I_ld-positive(x-w/2，y-w/2)+I_ld-negative(x+w/2，y+w/2))/2；

此外，向相反方向移位并相加的计算可以基于以下公式(2)：

I_h’(x，y)＝(I_h-positive(x，y+w/2)+I_h-negative(x，y-w/2))/2，

I_v’(x，y)＝(I_v-positive(x+w/2，y)+I_v-negative(x-w/2，y))/2，

I_rd’(x，y)＝(I_rd-positive(x-w/2，y+w/2)+I_rd-negative(x+w/2，y-w/2))/2，以及

I_ld’(x，y)＝(I_ld-positive(x+w/2，y+w/2)+I_ld-negative(x-w/2，y-w/2))/2；

其中，x表示像素的横坐标，y表示像素的纵坐标，I_h(x，y)、I_v(x，y)、I_rd(x， y)和I_ld(x，y)分别表示针对像素的横向、纵向以及两个对角线方向这四个方向的第一合成图像数据，其中，包含第一合成图像数据的图像如图5A-5D所示。

图5A示出包含数据I_h(x，y)的图像，图5B示出包含数据I_v(x，y)的图像，图5C示出包含数据I_rd(x，y)的图像，图5D示出包含数据I_ld(x，y)的图像。

I_h’(x，y)、I_v’(x，y)和I_rd’(x，y)、I_ld’(x，y)分别表示针对像素的横向、纵向以及两个对角线方向这四个方向的第二合成图像数据。其中，包含第二合成图像数据的图像如图6A-6D所示。

图6A示出包含数据I_h’(x，y)的图像，图6B示出包含数据I_v’(x，y)的图像，图6C示出包含数据I_rd’(x，y)的图像，图6D示出包含数据I_ld’(x，y)的图像。

I_h-positive(x，y)、I_v-positive(x，y)、I_rd-positive(x，y)和I_ld-positive(x，y)分别表示针对像素的横向、纵向以及两个对角线方向这四个方向的正脉冲响应图像数据。其中，包含正脉冲相应图像数据的图像如图4A、4C、4E和4G所示。

I_h-negative(x，y)、I_v-negative(x，y)、I_rd-negative(x，y)和I_ld-negative(x，y)分别表示针对像素的横向、纵向以及两个对角线方向这四个方向的负脉冲响应图像数据。其中，包含负脉冲相应图像数据的图像如图4B、4D、4F和4H所示。

上述处理中涉及的w为预先估计的笔划宽度。例如，可以根据经验来估计w的值，或者可以通过对图像进行目测来估计w的值。此外，上述公式1 和2只是给出了针对像素的横向、纵向以及两个对角线方向这四个方向的图像数据进行合成处理的一个具体例子，而并不构成对本发明的限制。实际上，任何用于加强笔划的合适的合成处理都是适用的。

应理解，进行向相对方向移位以及向相反方向移位的原因在于，对于一个非特定图像不一定容易确定哪个方向的移位可以达到对笔划加强的效果。为此，通过尝试性地分别进行向相对方向移位以及向相反方向移位总是可以达到笔划加强的效果。如果可以事先确定哪个方向的移位可以达到对笔划加强的效果，则不一定同时执行向相对方向移位以及向相反方向移位，即，只需要向相对方向移位和向相反方向移位之一。在本文所给出的图像示例中，向相对方向的移位可以达到对笔划加强的效果，如图5A-5D所示。向相反方向的移位不能达到对笔划加强的效果，如图6A-6D所示。

在步骤S208中，可以对在步骤S206中合成后的图像进行高阈值的二值化处理和整合处理。

例如，可以利用预先设定的高阈值分别对针对各个方向的第一合成图像数据和第二合成图像数据进行高阈值的二值化处理。对经过高阈值的二值化处理的针对各个方向的第一合成图像数据进行整合处理，并对经过高阈值的二值化处理的针对各个方向的第二合成图像数据进行整合处理。

此处的整合处理可以为求交集处理、求最大值处理或求平均处理之一。

如果整合处理为求交集处理，则可以通过如下公式来进行求交集处理：

I_output-thin＝I_{h-binarized-high}UI_{v-binarized-high}UI_{rd-binarized-high}UI_{ld-binarized-high}

I’_output-thin＝I’_{h-binarized-high}UI’_{v-binarized-high}UI’_{rd-binarized-high}UI’_{ld-binarized-high}

其中，I_output-thin为求交集后的第一细笔划图像数据，I_{h-binarized-high}、 I_{v-binarized-high}、I_{rd-binarized-high}和I_{ld-binarized-high}分别为对第一合成图像数据I_h(x，y)、 I_v(x，y)、I_rd(x，y)和I_ld(x，y)进行高阈值的二值化后得到的二值化图像数据。其中，I’_output-thin为求交集后的第二细笔划图像数据，I’_{h-binarized-high}、I’_{v-binarized-high}、 I’_{rd-binarized-high}和I’_{ld-binarized-high}分别为对第二合成图像数据I_h’(x，y)、I_v’(x，y)、 I_rd’(x，y)和I_ld’(x，y)进行高阈值的二值化后得到的二值化图像数据。

在步骤S210，可以获得细笔划图像数据。即，获得I_output-thin和I’_output-thin。

在步骤S212中，可以对合成后的图像进行低阈值的二值化处理和整合处理。

例如，可以利用预先设定的小于上述高阈值的低阈值分别对针对各个方向的第一合成图像数据和第二合成图像数据进行低阈值的二值化处理。对经过低阈值的二值化处理的针对各个方向的第一合成图像数据进行整合处理，并对经过第二二值化处理的针对各个方向的第二合成图像数据进行整合处理。

此处的整合处理可以为求交集处理、求最大值处理或求平均处理之一。

如果整合处理为求交集处理。例如，可以通过如下公式来进行求交集处理：

I_output-thick＝I_{h-binarized-low}UI_{v-binarized-low}UI_{rd-binarized-low}UI_{ld-binarized-low}

I’_output-thick＝I’_{h-binarized-low}UI’_{v-binarized-low}UI’_{rd-binarized-low} U I’_{ld-binarized-low}

其中，I_output-thick为求交集后的第一粗笔划图像数据，I_{h-binarized-low}、 I_{v-binarized-low}、I_{rd-binarized-low}和I_{ld-binarized-low}分别为对第一合成图像数据I_h(x，y)、 I_v(x，y)、I_rd(x，y)和I_ld(x，y)进行低阈值的二值化后得到的二值化图像数据。其中，I’_output-thick为求交集后的第二粗笔划图像数据，I’_{h-binarized-low}、I’_{v-binarized-low}、 I’_{rd-binarized-low}和I’_{ld-binarized-low}分别为对第二合成图像数据I_h’(x，y)、I_v’(x，y)、 I_rd’(x，y)和I_ld’(x，y)进行低阈值的二值化后得到的二值化图像数据。

容易理解，正如上述的，如果可以事先确定哪个方向的移位可以达到对笔划加强的效果，则不一定同时执行向相对方向移位以及向相反方向移位，以便得到第一合成图像数据和第二合成图像数据。也即，只需要在可以达到对笔划加强的效果的方向上(例如相对方向或者相反方向)进行移位并得到相应的合成图像数据，相应地，上述的二值化处理和整合处理也只需要针对该合成图像数据执行即可。

在步骤S214，可选地，根据预定的过滤条件对在步骤S212中处理后的数据进行过滤。

具体地，利用预定过滤条件分别对第一粗笔划图像数据和第二粗笔划图像数据中的与连通域相关的数据进行过滤处理，以获得满足预定过滤条件的第一连通域图像数据和第二连通域图像数据。

在此处利用预定过滤条件对第一粗笔划图像数据和第二粗笔划图像数据进行过滤处理的原因在于，在步骤S212中获得的第一粗笔划图像数据和第二粗笔划图像数据除了包含粗笔划之外，还可能包含其他物体的边缘数据，例如，图像中的人体边缘数据或其他类似于粗笔划的边缘数据。通过利用预定过滤条件对第一粗笔划图像数据和第二粗笔划图像数据进行过滤处理，可以更加准确地获得与粗笔划对应的连通域图像数据。

其中，预定过滤条件可以是以下条件之一：(1)连通域内的像素的灰度方差小于预定方差阈值，(2)连通域的内边缘到外边缘的像素极性一致，以及(3)连通域的大小在预定大小阈值内；或者过滤条件可以是上述(1)、(2) 和(3)中两项或多项的任意结合。

这里，连通域是指由通过步骤S212的处理获得的粗笔划图像数据所代表的边缘所构成的封闭区域。

对于过滤条件(1)，即，连通域内的像素的灰度方差小于预定方差阈值，具体地，首先，可以在步骤S212中处理过的图像中找到与连通域相关的坐标信息。然后，基于坐标信息并基于如图3所示的原始图像，来确定连通域的灰度方差，并判断该连通域内的灰度方差是否小于预定方差阈值。在连通域内的灰度方差小于预定方差阈值的情况下，保留该连通域，即，认为该连通域与粗笔划关联。否则，过滤掉该连通域。

对于过滤条件(2)，即，连通域的内边缘到外边缘的像素极性一致，具体地，首先，可以在步骤S212中处理过的图像中找到与连通域相关的坐标信息。然后，基于坐标信息并基于如图3所示的原始图像，来确定连通域的内边缘到外边缘的像素极性是否一致。在连通域内的内边缘和外边缘的像素极性一致的情况下，保留该连通域，即，认为该连通域与粗笔划关联。否则，过滤掉该连通域。

这里所说的像素的极性可以理解为一个内边缘像素的灰度和与该内边缘像素相邻的外边缘像素的灰度之间的关系。例如，二值化图像中像素的灰度被设置为是“0”或“255”，则如果两个像素的灰度值都为“0”或者都为 “255”，认为这两个像素的极性一致，反之则认为极性不一致。当然，也可以根据实际需要来设定像素极性为一致的其他合适条件，在此不再赘述。

对于过滤条件(3)，即，连通域的大小在预定大小阈值内，具体地，如果连通域的大小在预定阈值内，则保留该连通域，即，认为该连通域与粗笔划关联。否则，过滤掉该连通域。容易理解，粗笔划图像虽然相对于细笔划图像要大，但是一般具有比较通用的上限，可以据此上限来设定上述的预定阈值。如果连通域的尺寸过大，则可以认为该连通域所对应的不是粗笔划而是非笔划对象，例如，在绝大多数情况下粗笔划尺寸不会占据整个图像的尺寸的一半甚至更多。当然，在特殊情况下粗笔划尺寸的确很大，则只需要调整上述的预定阈值的大小即可反映这种情况。

其中，上述的预定方差阈值和预定大小的阈值可以根据预先通过实验获取的经验值来确定，或者可以根据对图像样本的目测来确定。当然，也可以根据任何其他适当方法来确定。

也可以结合过滤条件(1)、(2)和(3)中的两项或全部的任意组合来执行过滤。

接下来，在步骤S216中，获得分别与第一连通域图像数据和第二连通域图像数据相对应的第一粗笔划边缘图像数据和第二粗笔划边缘图像数据。

在步骤S218中，获得分别与第一细笔划图像数据和第二细笔划图像数据相对应的第一细笔划图像(如图7所示)和第二细笔划图像(未示出)，并获得分别与第一粗笔划边缘图像数据和第二粗笔划边缘图像数据相对应的第一粗笔划图像(如图9所示)和第二粗笔划图像(未示出)。

应理解，在不执行步骤S214的情况下，也可以得到粗笔划图像。换句话说，可以基于步骤S212获得的I_output-thick和I’_output-thick来得到第一粗笔划图像(如图8所示)和第二粗笔划图像。

在本文中，尽管通过上述步骤可以得到第二细笔划图像和第二粗笔划图像，但由于向相反方向的移位不能达到对笔划加强的效果，因此没有具体示出相应得到的第二细笔划图像、第二粗笔划图像。

可选地，可以基于文本笔划的精度、文本笔划的召回率、或者文本笔划的精度和文本笔划的召回率的折中，来筛选第一细笔划图像和第二细笔划图像中的一个作为最终的细笔划图像。也可以基于文本笔划的精度、文本笔划的召回率、或者文本笔划的精度和文本笔划的召回率的折中，来筛选第一粗笔划图像和第二粗笔划图像中的一个作为最终的粗笔划图像。在本文的示例中，由于相对方向的移位可以达到对笔划加强的效果，因此，基于文本笔划的精度、文本笔划的召回率、或者文本笔划的精度和文本笔划的召回率的折中，可以得到第一细笔划图像和第一粗笔划图像作为最终的笔划提取结果。

本文中所提到的文本笔划的精度可以理解为实际检测到的正确笔划的数量与实际检测到的笔划的数量之比，文本笔划的召回率可以理解为实际检测的正确笔划的数量与实际存在的正确笔划的数量之比。

上述以索贝尔算子为例描述了从图像中提取文本笔划图像的方法。但这仅是以示例的方式描述从图像中提取文本笔划图像的方法。可以使用的算子不局限于此，而可以是Robert算子、Prewitt算子、Laplace算子、log算子、 Canny算子或者其他任意的适当算子。

此外，尽管在步骤S208和S212中描述了先进行二值化处理再进行整合处理，但实际上也可以先进行整合处理再进行二值化处理。

上述提到的高阈值和低阈值可以根据经验来确定，或者通过若干次的试验来确定。但这仅是示例，可以通过任意适当的方法来确定高阈值和低阈值。

以下参照图10来描述根据本发明实施例的用于从图像中提取文本笔划图像的装置400。

图10是示出根据本发明实施例的用于从图像中提取文本笔划图像的装置400的框图。装置400例如可以执行上述参照图1描述的用于从图像中提取文本笔划图像的方法。

具体地，装置400包括：信息获取单元402，可以用于获取所述图像的边缘信息和梯度信息；强化单元404，可以用于对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化所述图像中与文本有关的边缘信息和梯度信息；以及笔划图像获得单元406，可以用于获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

可选地，装置400可以包括筛选单元(未示出)。筛选单元可以被配置为对所提取出的多个文本笔划图像进行筛选。

信息获取单元402可以被配置为对代表图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分析，根据分析结果来提取边缘信息和梯度信息。

可选地，装置400还可以包括降噪单元(未示出)。降噪单元可以被配置为根据图像的清晰程度或在需要的情况下，对原始图像进行滤波以降噪。例如，可以利用低通滤波器对图像进行滤波，以抑制原始图像中的噪声。低通滤波器例如可以是高斯滤波器，但是低通滤波器不限于此，而可以是本领域技术人员已知的任何适当的低通滤波器。

强化单元404也可以被配置为基于各种方法来对边缘信息和梯度信息进行加强处理。优选地，可以通过二值化处理和整合处理来对边缘信息和梯度信息进行加强。此处的整合处理可以为求交集处理、求最大值处理或求平均处理之一。优选地，整合处理可以为求交集处理，这将稍后详细描述。

以下参照图11来描述根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的装置400’。

图11是示出根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的装置400’的框图。

装置400’可以执行以上参照图2-图9描述的根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法。

具体地，类似于装置400，装置400’包括信息获取单元402’、强化单元 404’、以及笔划图像获得单元406’。可选地，装置400’也可以包括筛选单元和降噪单元(均未示出)。

筛选单元可以被配置为基于文本笔划的精度和文本笔划的召回率中的至少一个，筛选所述第一细笔划图像和所述第二细笔划图像中的一个作为最终的细笔划图像和/或筛选所述第一粗笔划图像和所述第二粗笔划图像中的一个作为最终的粗笔划图像。具体的筛选处理已参照图2-图9进行描述，在此不再重复。

降噪单元可以被配置为对原始图像(即要处理的图像)进行滤波以降噪。具体的降噪处理已参照图2-图9进行描述，在此不再重复。

其中，信息获取单元402’可以包括卷积运算子单元4022和划分子单元 4024。卷积运算子单元4022被配置为利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算。划分子单元4024被配置为将针对各个方向的卷积计算的结果划分为针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据。

强化单元404’可以包括第一合成图像获得子单元4042和/或第二合成图像获得子单元4044。第一合成图像获得子单元4042可以被配置为对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相对方向移位并相加的计算，以获得针对各个方向的第一合成图像数据。第二合成图像获得子单元4044可以被配置为对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相反方向移位并相加的计算，以获得针对各个方向的第二合成图像数据。

所述笔划图像获得单元406’可以包括：第一二值化处理子单元4062、第一细笔划图像获得子单元4064、第二细笔划图像获得子单元4066、第二二值化处理子单元4068、第一粗笔划图像获得子单元40610和第二粗笔划图像获得子单元40612。

第一二值化处理子单元4062可以被配置为利用预先设定的第一阈值分别对针对各个方向的第一合成图像数据和第二合成图像数据进行第一二值化处理。

第一细笔划图像获得子单元4064可以被配置为对经过第一二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一细笔划图像数据，从而获得与所述第一细笔划图像数据相对应的第一细笔划图像。

第二细笔划图像获得子单元4066可以被配置为对经过第一二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二细笔划图像数据，从而获得与第二细笔划图像数据相对应的第二细笔划图像。

第二二值化处理子单元4068可以被配置为利用预先设定的小于第一阈值的第二阈值分别对针对各个方向的第一合成图像数据和第二合成图像数据进行第二二值化处理。

第一粗笔划图像获得子单元40610可以被配置为对经过第二二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一粗笔划边缘图像数据，从而获得与所述第一粗笔划边缘图像数据相对应的第一粗笔划图像。

第二粗笔划图像获得子单元40612可以被配置为对经过第二二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二粗笔划边缘图像数据，从而获得与所述第二粗笔划边缘图像数据相对应的第二粗笔划图像。

根据需要，笔划图像获得单元406可以只包括第一二值化处理子单元 4062、第一细笔划图像获得子单元4064和第二细笔划图像获得子单元4066，或者只包括第二二值化处理子单元4068、第一粗笔划图像获得子单元40610 和第二粗笔划图像获得子单元40612。换句话说，根据需要，笔划图像获得单元406可以被配置为只获得细笔划图像或者只获得粗笔划图像，例如在待处理图像只存在粗笔划或者细笔划的文本信息，或者只需要提取粗笔划或者细笔划的文本信息的情形。

而且，如上述所述，如果可以事先确定哪个方向的移位可以达到对笔划加强的效果，则强化单元404’可以包括第一合成图像获得子单元4042和第二合成图像获得子单元4044中与该方向上的处理对应的合成图像获得子单元之一，相应地，笔划图像获得单元406’可以只包括与该方向上的处理对应的第一细笔划图像获得子单元4064和第二细笔划图像获得子单元4066中之一，以及包括与该方向上的处理对应的第一粗笔划图像获得子单元40610和第二粗笔划图像获得子单元40612中之一。

装置400’例如可以被配置成执行以上参照图2-图9描述的根据本发明实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法。为了简明，在此不再具体描述第一二值化处理子单元4062、第一细笔划图像获得子单元 4064、第二细笔划图像获得子单元4066、第二二值化处理子单元4068、第一粗笔划图像获得子单元40610和第二粗笔划图像获得子单元40612的具体处理过程。

此外，可选地，笔划图像获得单元406’还可以包括过滤子单元(未示出)。过滤子单元可以被配置为利用预定过滤条件分别对第一粗笔划边缘图像数据和第二粗笔划边缘图像数据中的与连通域相关的数据进行过滤处理，以获得满足预定过滤条件的第一连通域图像数据和第二连通域图像数据。

预定过滤条件包括以下条件中的至少之一：所述连通域内的像素的灰度方差小于预定方差阈值；所述连通域的内边缘到外边缘的像素极性一致；以及所述连通域的大小在预定大小阈值内。关于预定过滤条件已参照图2-图9 进行描述，在此不再重复。

通过根据本发明实施例的用于从图像中提取文本笔划图像的方法和装置可以实现以下技术效果中的至少之一：速度快、提取笔画的同时可以抑制噪声、对笔画尺度不敏感、由于所处理视频的质量较差。此外，根据本发明实施例的用于从图像中提取文本笔划图像的方法和装置对文本的颜色、文本背景对比度等先验知识没有要求。

以上结合具体实施例描述了本发明的基本原理，但是，需要指出的是，对本领域的普通技术人员而言，能够理解本发明的方法和装置的全部或者任何步骤或者部件，可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中，以硬件、固件、软件或者它们的组合加以实现，这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。

因此，本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此，本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说，这样的程序产品也构成本发明，并且存储有这样的程序产品的存储介质也构成本发明。显然，所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。

在通过软件和/或固件实现本发明的实施例的情况下，从存储介质或网络向具有专用硬件结构的计算机，例如图12所示的通用计算机1200安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等等。

在图12中，中央处理单元(CPU)1201根据只读存储器(ROM)1202中存储的程序或从存储部分1208加载到随机存取存储器(RAM)1203的程序执行各种处理。在RAM 1203中，也根据需要存储当CPU 1201执行各种处理等等时所需的数据。CPU 1201、ROM 1202和RAM 1203经由总线1204彼此链路。输入/输出接口1205也链路到总线1204。

下述部件链路到输入/输出接口1205：输入部分1206(包括键盘、鼠标等等)、输出部分1207(包括显示器，比如阴极射线管(CRT)、液晶显示器(LCD) 等，和扬声器等)、存储部分1208(包括硬盘等)、通信部分1209(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1209经由网络比如因特网执行通信处理。根据需要，驱动器1210也可链路到输入/输出接口1205。可拆卸介质1211比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1210上，使得从中读出的计算机程序根据需要被安装到存储部分1208中。

在通过软件实现上述系列处理的情况下，从网络比如因特网或存储介质比如可拆卸介质1211安装构成软件的程序。

本领域的技术人员应当理解，这种存储介质不局限于图12所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1211。可拆卸介质1211的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标)) 和半导体存储器。或者，存储介质可以是ROM 1202、存储部分1208中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。

本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时，可执行上述根据本发明实施例的方法。

相应地，用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。

本领域的普通技术人员应理解，在此所例举的是示例性的，本发明并不局限于此。

在本说明书中，“第一”、“第二”以及“第N个”等表述是为了将所描述的特征在文字上区分开，以清楚地描述本发明。因此，不应将其视为具有任何限定性的含义。

作为一个示例，上述方法的各个步骤以及上述设备的各个组成模块和/ 或单元可以实施为软件、固件、硬件或其组合，并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知，在此不再赘述。

作为一个示例，在通过软件或固件实现的情况下，可以从存储介质或网络向具有专用硬件结构的计算机(例如图12所示的通用计算机1200)安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等。

在上面对本发明具体实施例的描述中，针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用，与其他实施方式中的特征相组合，或替代其他实施方式中的特征。

应该强调，术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。

此外，本发明的方法不限于按照说明书中描述的时间顺序来执行，也可以按照其他的时间顺序地、并行地或独立地执行。因此，本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。

关于包括以上实施例的实施方式，还公开下述附记：

附记

附记1.一种用于从图像中提取文本笔划图像的方法，包括：

获取所述图像的边缘信息和梯度信息；

对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化所述图像中与文本有关的边缘信息和梯度信息；以及

获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

附记2.根据附记1所述的方法，其中，所述获取所述图像的边缘信息和梯度信息的步骤包括：

对代表所述图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分析，根据分析结果来提取所述边缘信息和所述梯度信息。

附记3.根据附记2所述的方法，其中：

所述获取所述图像的边缘信息和梯度信息的步骤包括：

利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算，以及

将针对各个方向的卷积计算的结果划分为针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据；

所述强化所述图像中与文本有关的边缘信息和梯度信息的步骤包括：

对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相对方向移位并相加的计算，以获得针对各个方向的第一合成图像数据，和/或

对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相反方向移位并相加的计算，以获得针对各个方向的第二合成图像数据；

所述获得与经强化的边缘信息和梯度信息相对应的文本笔划图像的步骤包括：

利用预先设定的第一阈值分别对针对各个方向的第一合成图像数据和/或第二合成图像数据进行第一二值化处理，对经过第一二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一细笔划图像数据，从而获得与所述第一细笔划图像数据相对应的第一细笔划图像，和/或对经过第一二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二细笔划图像数据，从而获得与所述第二细笔划图像数据相对应的第二细笔划图像；和/或

利用预先设定的小于第一阈值的第二阈值分别对针对各个方向的第一合成图像数据和/或第二合成图像数据进行第二二值化处理，对经过第二二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一粗笔划边缘图像数据，从而获得与所述第一粗笔划边缘图像数据相对应的第一粗笔划图像，和/或对经过第二二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二粗笔划边缘图像数据，从而获得与所述第二粗笔划边缘图像数据相对应的第二粗笔划图像。

附记4.根据附记3所述的方法，其中，所述整合处理包括求交集处理、求最大值处理和求平均处理之一。

附记5.根据附记3或4所述的方法，其中，在所述利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算的步骤包括：

利用用于获取图像的横向、纵向以及两个对角线方向这四个方向上的边缘信息和梯度信息的四个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算。

附记6.根据附记3至5中任一项所述的方法，其中，所述向相对方向移位并相加的计算基于以下公式：

I_h(x，y)＝(I_h-positive(x，y-w/2)+I_h-negative(x，y+w/2))/2，

I_v(x，y)＝(I_v-positive(x-w/2，y)+I_v-negative(x+w/2，y))/2，

I_rd(x，y)＝(I_rd-positive(x+w/2，y-w/2)+I_rd-negative(x-w/2，y+w/2))/2，以及

I_ld(x，y)＝(I_ld-positive(x-w/2，y-w/2)+I_ld-negative(x+w/2，y+w/2))/2；

并且其中，所述向相反方向移位并相加的计算基于以下公式：

I_h’(x，y)＝(I_h-positive(x，y+w/2)+I_h-negative(x，y-w/2))/2，

I_v’(x，y)＝(I_v-positive(x+w/2，y)+I_v-negative(x-w/2，y))/2，

I_rd’(x，y)＝(I_rd-positive(x-w/2，y+w/2)+I_rd-negative(x+w/2，y-w/2))/2，以及

I_ld’(x，y)＝(I_ld-positive(x+w/2，y+w/2)+I_ld-negative(x-w/2，y-w/2))/2；

其中，x表示像素的横坐标，y表示所述像素的纵坐标，I_h(x，y)、I_v(x， y)、I_rd(x，y)和I_ld(x，y)分别表示针对所述像素的横向、纵向以及两个对角线方向这四个方向的第一合成图像数据，

I_h’(x，y)、I_r’(x，y)和I_rd’(x，y)、I_ld’(x，y)分别表示针对所述像素的横向、纵向以及两个对角线方向这四个方向的第二合成图像数据，

I_h-positive(x，y)、I_v-positive(x，y)、I_rd-positive(x，y)和I_ld-positive(x，y)分别表示针对所述像素的横向、纵向以及两个对角线方向这四个方向的正脉冲响应图像数据，以及

I_h-negative(x，y)、I_v-negative(x，y)、I_rd-negative(x，y)和I_ld-negative(x，y)分别表示针对所述像素的横向、纵向以及两个对角线方向这四个方向的负脉冲响应图像数据， w为预先估计的笔划宽度。

附记7.根据附记3至6中任一项所述的方法，其中，所述获得分别与所述第一粗笔划边缘图像数据和所述第二粗笔划边缘图像数据相对应的第一粗笔划图像和第二粗笔划图像的步骤包括：

利用预定过滤条件分别对所述第一粗笔划边缘图像数据和所述第二粗笔划边缘图像数据中的连通域数据进行过滤处理，以获得满足所述预定过滤条件的第一连通域图像数据和第二连通域图像数据；以及

获得分别与所述第一连通域图像数据和所述第二连通域图像数据相对应的第一粗笔划图像和第二粗笔划图像。

附记8.根据附记7所述的方法，其中，所述预定过滤条件包括以下条件中的至少之一：

所述连通域内的像素的灰度方差小于预定方差阈值；

所述连通域的内边缘到外边缘的像素极性一致；以及

所述连通域的大小在预定大小阈值内。

附记9.根据附记3至8中任一项所述的方法，还包括：

基于文本笔划的精度和文本笔划的召回率中的至少一个，筛选所述第一细笔划图像和所述第二细笔划图像中的一个作为最终的细笔划图像和/ 或筛选所述第一粗笔划图像和所述第二粗笔划图像中的一个作为最终的粗笔划图像。

附记10.一种用于从图像中提取文本笔划图像的装置，包括：

信息获取单元，用于获取所述图像的边缘信息和梯度信息；

强化单元，用于对所获取的边缘信息和梯度信息进行预定的加强处理，从而强化所述图像中与文本有关的边缘信息和梯度信息；以及

笔划图像获得单元，用于获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

附记11.根据附记10所述的装置，其中，所述信息获取单元被配置为对代表所述图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分析，根据分析结果来提取所述边缘信息和所述梯度信息。

附记12.根据附记11所述的装置，其中：

所述信息获取单元包括：

卷积运算子单元，用于利用用于获取图像在多个方向上的边缘信息和梯度信息的多个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算，以及

划分子单元，用于将针对各个方向的卷积计算的结果划分为针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据；

所述强化单元包括：

第一合成图像获得子单元，用于对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相对方向移位并相加的计算，以获得针对各个方向的第一合成图像数据，和/或

第二合成图像获得子单元，用于对于针对各个方向的正脉冲响应图像数据和负脉冲响应图像数据执行向相反方向移位并相加的计算，以获得针对各个方向的第二合成图像数据；

所述笔划图像获得单元包括：

第一二值化处理子单元，用于利用预先设定的第一阈值分别对针对各个方向的第一合成图像数据和/或第二合成图像数据进行第一二值化处理；第一细笔划图像获得子单元，用于对经过第一二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一细笔划图像数据，从而获得与所述第一细笔划图像数据相对应的第一细笔划图像；和/或第二细笔划图像获得子单元，用于对经过第一二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二细笔划图像数据，从而获得与第二细笔划图像数据相对应的第二细笔划图像；和/或

第二二值化处理子单元，用于利用预先设定的小于第一阈值的第二阈值分别对针对各个方向的第一合成图像数据和/或第二合成图像数据进行第二二值化处理；第一粗笔划图像获得子单元，用于对经过第二二值化处理的针对各个方向的第一合成图像数据进行整合处理以获得第一粗笔划边缘图像数据，从而获得与所述第一粗笔划边缘图像数据相对应的第一粗笔划图像；和/或第二粗笔划图像获得子单元，用于对经过第二二值化处理的针对各个方向的第二合成图像数据进行整合处理以获得对应的第二粗笔划边缘图像数据，从而获得与所述第二粗笔划边缘图像数据相对应的第二粗笔划图像。

附记13.根据附记12所述的装置，其中，所述整合处理包括求交集处理、求最大值处理和求平均处理之一。

附记14.根据附记12或13所述的装置，其中，所述卷积运算子单元被配置为利用用于获取图像的横向、纵向以及两个对角线方向这四个方向上的边缘信息和梯度信息的四个索贝尔算子卷积核分别与所述图像的图像数据进行卷积计算。

附记15.根据附记12至14中任一项所述的装置，其中，所述向相对方向移位并相加的计算基于以下公式：

I_h(x，y)＝(I_h-positive(x，y-w/2)+I_h-negative(x，y+w/2))/2，

I_v(x，y)＝(I_v-positive(x-w/2，y)+I_v-negative(x+w/2，y))/2，

I_rd(x，y)＝(I_td-positive(x+w/2，y-w/2)+I_rd-negative(x-w/2，y+w/2))/2，以及

I_ld(x，y)＝(I_ld-positive(x-w/2，y-w/2)+I_ld-negative(x+w/2，y+w/2))/2；

并且其中，所述向相反方向移位并相加的计算基于以下公式：

I_h’(x，y)＝(I_h-positive(x，y+w/2)+I_h-negative(x，y-w/2))/2，

I_v’(x，y)＝(I_v-positive(x+w/2，y)+I_v-negative(x-w/2，y))/2，

I_rd’(x，y)＝(I_rd-positve(x-w/2，y+w/2)+I_rd-negative(x+w/2，y-w/2))/2，以及

I_ld’(x，y)＝(I_ld-postive(x+w/2，y+w/2)+I_ld-negative(x-w/2，y-w/2))/2；

I_h’(x，y)、I_v’(x，y)和I_rd’(x，y)、I_ld’(x，y)分别表示针对所述像素的横向、纵向以及两个对角线方向这四个方向的第二合成图像数据，

附记16.根据附记12至15中任一项所述的装置，其中，所述笔划图像获得单元还包括：

过滤子单元，用于利用预定过滤条件分别对所述第一粗笔划边缘图像数据和所述第二粗笔划边缘图像数据中的连通域数据进行过滤处理，以获得满足所述预定过滤条件的第一连通域图像数据和第二连通域图像数据。

附记17.根据附记16所述的装置，其中，所述预定过滤条件包括以下条件中的至少之一：

所述连通域内的像素的灰度方差小于预定方差阈值；

所述连通域的内边缘到外边缘的像素极性一致；以及

所述连通域的大小在预定大小阈值内。

附记18.根据附记12至17中任一项所述的装置，还包括：

筛选单元，用于基于文本笔划的精度和文本笔划的召回率中的至少一个，筛选所述第一细笔划图像和所述第二细笔划图像中的一个作为最终的细笔划图像和/或筛选所述第一粗笔划图像和所述第二粗笔划图像中的一个作为最终的粗笔划图像。

附记19.一种存储有机器可读取的指令代码的程序产品，所述指令代码由机器读取并执行时，可执行如附记1-9中任一项所述的用于从图像中提取文本笔划图像的方法。

附记20.一种承载有如附记19所述的程序产品的存储介质。

尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露，但是，应该理解，本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于从图像中提取文本笔划图像的方法和装置 [P] . 中国专利： CN102810155B . 2015.04.15
2. 从图像中提取文本区域的方法、装置、设备和存储介质 [P] . 中国专利： CN111275034A . 2020-06-12
3. METHOD AND DEVICE FOR EXTRACTING TEXT STROKE IMAGE FROM IMAGE [P] . 日本专利： JP2012252691A . 2012-12-20

机译：从图像中提取文本笔划图像的方法和装置
4. COMIC IMAGE ANALYSIS APPARATUS, PROGRAM, AND SEARCH APPARATUS AND METHOD FOR EXTRACTING TEXT FROM COMIC IMAGE [P] . 日本专利： JP2011128924A . 2011-06-30

机译：漫画图像分析装置，程序和搜索装置以及从漫画图像中提取文本的方法
5. METHOD AND APPARATUS FOR EXTRACITING TEXT DATA FROM NONLINEAR TEXT IMAGE [P] . 韩国专利： KR20190110873A . 2019-10-01

机译：从非线性文本图像中提取文本数据的方法和装置