首页> 中国专利> 一种基于骨架指导的文字图像矢量化方法及系统

一种基于骨架指导的文字图像矢量化方法及系统

摘要

本发明涉及一种基于骨架指导的文字图像矢量化方法及系统,其步骤包括:1)对于单个文字图像,系统使用形态学和各向异性扩散算法,对图像进行预处理,包括笔画连接以及边缘平滑;2)得到文字图像的骨架以及骨架上的关键点;3)提取出文字图像的边缘轮廓,将文字图像的边缘轮廓的曲率极值点分类为角点和连接点;4)使用加权的动态规划算法删除多余的连接点;5)曲线拟合,并使得连接点处的曲率连续。与现有技术相比,本发明的矢量化方法及系统可以保持文字书写风格中的重要细节,又能同时去除笔画轮廓上的噪声,且完全不需要人工的干预,算法可以自动运行,有利于矢量化的批量运行。

著录项

  • 公开/公告号CN103942552A

    专利类型发明专利

  • 公开/公告日2014-07-23

    原文格式PDF

  • 申请/专利权人 北京大学;

    申请/专利号CN201410047304.3

  • 发明设计人 潘婉琼;连宙辉;唐英敏;肖建国;

    申请日2014-02-11

  • 分类号G06K9/40(20060101);

  • 代理机构北京君尚知识产权代理事务所(普通合伙);

  • 代理人余长江

  • 地址 100871 北京市海淀区颐和园路5号北京大学

  • 入库时间 2023-12-17 00:55:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-08

    专利权的转移 IPC(主分类):G06K9/40 登记生效日:20180419 变更前: 变更后: 申请日:20140211

    专利申请权、专利权的转移

  • 2017-02-08

    授权

    授权

  • 2014-08-20

    实质审查的生效 IPC(主分类):G06K9/40 申请日:20140211

    实质审查的生效

  • 2014-07-23

    公开

    公开

说明书

技术领域

本发明涉及一种图像矢量化方法及系统,具体涉及一种图像去噪、图像增强、生成图像 骨架、边缘检测和曲线拟合的方法进行基于骨架指导的文字图像矢量化方法及系统,属于计 算机图像处理技术领域。

背景技术

书法是中国上下五千年文明历史中的珍贵文化瑰宝,被誉为:无言的诗,无行的舞, 无图的画,无声的乐。从甲骨文、金文演变而为大篆、小篆、隶书,至东汉、魏、晋的 草书、楷书、行书诸体,书法一直散发着独特的艺术魅力。

中国书法历史悠久,书体沿革流变,书法艺术美丽迷人。随着科技的发展,为了更 好的保护书法作品,常常需要将其电子化。但是由于书法常常是刻在石碑,或者是用毛 笔写在宣纸上,扫描得到的书法文字都包含大量的噪声,并且常存在笔画断裂的情况。 这就需要矢量化算法能够对噪声有极大的鲁棒性,并且在去除噪声的同时,要选择性的 保留原有书法作品中的笔画细节。

图像的矢量化是指将位图图像转换成矢量图的一种技术:位图由一个一个的像素组 成,伸缩后会产生锯齿状的噪声;矢量图是由数学公式表示的曲线组成,具有伸缩不变 形。由于字体在使用的过程中常常需要不同的字号,因此几乎所有的字库都是用矢量化 的文字轮廓表示的。

传统商业公司在进行书法文字图像的矢量化时,为了使得矢量化的效果更好,常常 加入一些人工的干预和指导,这就加大了矢量化的成本,并且减慢了矢量化的速度。

现有的自动化矢量化方法和系统中,对于所有输入的图像都采用完全相同的处理算 法,从不进行图像内容分析,也不关注图像自身的特征,导致这些方法很难区分出图像 中的噪声和细节特征,如果去除所有的噪声,那么图像的细节也会同时被丢失;如果保 留太多细节的话,噪声会使得结果显得很不美观,失去了矢量化的意义。

发明内容

本发明的目的在于提出了一种基于骨架指导的文字图像矢量化方法和系统,可以有效的 解决笔画的断裂问题,并在保持文字重要细节特征的前提下,选择性的去除文字轮廓上的锯 齿噪声。

为了实现上述目的,本发明采用的技术方案如下:

一种基于骨架指导的文字图像矢量化的方法,其步骤包括:

1)对单个文字图像进行预处理,包括文字图像的二值化、文字笔画的连接和文字边缘的 平滑;

2)获取预处理后单个文字图像的骨架信息,所述骨架信息包括骨架、骨架点以及骨架上 的关键点;

3)提取出文字图像的边缘轮廓,并找出边缘轮廓上的曲率极值点,然后根据骨架上的关 键点将曲率极值点划分为:角点和连接点;

4)从上述角点和连接点中筛选出最优的轮廓分割点,所述最优的轮廓分割点将文字图像 的边缘轮廓划分为若干轮廓段,每个单独的轮廓段都使用一条贝塞尔曲线进行曲线拟合,同 时使曲线拟合过程中连接点处的曲率连续,最终得到矢量化的文字轮廓。

本发明中,对于输入图像的格式颜色和分辨率无任何的要求,可以是手机拍摄的图像, 也可以是扫描得到的图像。

更进一步,所述对单个文字图像进行预处理,包括以下几个步骤:

1)图像二值化;

2)使用数学形态学中的膨胀算法,对图像进行膨胀操作,连接断裂的笔画;

3)使用各项异性扩散算法,平滑文字轮廓;

4)使用形态学中的腐蚀算法,对图像进行腐蚀操作,消除由于膨胀算法引起的笔画宽 度变化影响;

5)使用各项异性扩散算法,进一步的平滑文字轮廓。

进一步地,通过骨架增长算法获取预处理后单个文字图像的骨架及骨架点,然后使用关 键点检测算法得到骨架上的关键点,所述关键点检测算法包括Harris角点检测算法。

进一步地,使用边缘检测算法提取出文字图像的边缘轮廓及边缘轮廓上的轮廓点,从所 述轮廓点中找出边缘轮廓中的曲率极值点,所述边缘检测算法包括Sobel算子,Canny算子。

更进一步,所述曲率极值点划分,具体包括以下步骤:

1)得到文字图像的骨架和骨架上的关键点之后,在文字图像的边缘轮廓中,为骨架中 的每个关键点P划分一个半径为DisT的圆形区域R。

2)DisT的值等于关键点P到最近d个轮廓点的平均距离,d为在关键点P的八邻域中 的骨架点的个数。这些值都可以通过算法自动计算得到,不需要预先设定。

3)在区域R内的曲率极值点被选为角点,剩下的曲率极值点作为连接点。

更进一步,使用加权的动态规划算法对曲率极值点进行筛选,得到最优的轮廓分割点。 具体包括:

枚举任意两个曲率极值点作为轮廓段的端点P[i],P[j],对轮廓段进行曲线拟合,并记录 该轮廓段的最大拟合误差。如果该最大拟合误差小于阈值T,则可以使用一条贝塞尔曲线对 这段轮廓进行拟合,P[i+1]到P[j-1]的曲率极值点都会被删除;否则不能删除任何曲率极值点。 动态规划算法结束后,剩下的曲率极值点就作为最优的轮廓分割点。

进一步地,如果轮廓段的两个端点都是连接点的话,误差阈值T等于T1;否则,误差阈 值T等于T2。且T1>T2,误差阈值越大,被删除的曲率极值点越多,轮廓的细节就被保留的 越少。这就保证了,在角点的周围,阈值等于T2,算法会自动的保持更多的轮廓细节特征。

更进一步,所述曲线拟合包括以下步骤:

1)使用最小二乘法计算贝塞尔曲线的控制点位置;

2)若拟合的平均误差大于一个给定的阈值T3,则使用牛顿迭代法进行优化;

3)拟合的过程中,保证连接点处的曲率连续。

可选地,所述阈值T1优选为3.0,T2优选为1.5,T3优选为0.5。

本发明还提出一种基于骨架指导的文字图像矢量化系统,包括:

预处理模块,用于对文字图像进行预处理;

骨架生成模块,用于生成文字图像骨架;

分类模块,用于根据提取到的文字图像的边缘轮廓,将边缘轮廓的曲率极值点划分 为角点和连接点;

筛选模块,用于从曲率极值点中筛选出最优的轮廓分割点;

曲线拟合模块,用于将最优的轮廓分割点划分出的轮廓段拟合为贝塞尔曲线。

与现有技术相比,本发明的积极效果在于:

本发明利用了文字图像最有代表性的特征——骨架作为指导信息,有选择性的将一 些笔画轮廓上的细节特征区分为噪声或者是书写风格,从而最大的还原出原有字体的风 格特征。相较于现有技术,本方法在矢量化的过程中有针对性的识别出细节和噪声的不 同,可以完整的保持原作者的书写风格,并且有效的消除书写和扫描产生的锯齿噪声。 另一方法,本发明在矢量化的过程中,完全不需要人工的干预,有利于图像的批量处理。

附图说明

图1是本发明所述的基于骨架指导的文字矢量化方法及系统的流程图;

图2是本发明所述的预处理流程图;

图3是本发明所述的输入的单个文字图像;

图4是本发明所述的预处理效果示意图;

图5是本发明所述的文字骨架图;

图6是本发明所述的文字轮廓的曲率极值点示意图;

图7是本发明所述的曲率极值点分类效果示意图;

图8是本发明所述的曲线拟合结果示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整 地描述,可以理解的是,所描述的实例仅仅是本发明的一部分实施例,而不是全部的实 施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得 的所有其他实施例,都属于本发明保护的范围。

图1是本发明所述的基于骨架指导的文字图像矢量化方法及流程图,具体步骤如下:

1)系统对单个文字图像进行预处理,包括图像的二值化、笔画的连接和边缘的平滑, 具体步骤如图2所示,处理效果如图4所示。

2)对于预处理后的文字图像(见图4),系统使用骨架增长算法得到文字的骨架,骨架 图像如图5所示。

3)提取文字图像的轮廓,并计算曲率极值点。根据骨架信息的指导,对轮廓上的曲率 极值点进行分类,曲率极值点的示意图如图6所示,分类的效果如图7所示。

4)使用动态规划算法,从上述曲率极值点(即角点和连接点)中筛选出最优的轮廓分割 点。

5)根据最优的轮廓分割点,将文字的轮廓分为若干轮廓段,针对每个单独的轮廓段, 都使用一条贝塞尔曲线来拟合进行曲线拟合,并保证连接点处的曲率连续,得到矢量化的文 字图像。拟合效果如图8所示。

图2是本发明所述的预处理流程图,包含以下几个部分:

1)对输入的图像进行二值化(可参考百度百科—二值化 http://baike.baidu.com/view/983308.htm)的操作,若给定的阈值为T,那么,像素的值大于 等于T的像素将被设置为白色像素,小于T的则被设置为黑色像素;

2)使用数学形态学中的膨胀算法(可参考百度百科—形态学 http://baike.baidu.com/view/76767.htm中的第四部分),对图像进行N1次膨胀操作,连接断裂 的笔画;

3)使用各向异性扩散算法(可参考维基百科—各向异性扩散算法 http://en.wikipedia.org/wiki/Anisotropic_diffusion),迭代N2次,平滑文字轮廓;

4)使用数学形态学中的腐蚀算法(可参考百度百科—形态学 http://baike.baidu.com/view/76767.htm中的第四部分),对图像进行N1次腐蚀操作,消除由于 膨胀算法引起的笔画宽度变化影响;

5)使用各向异性扩散算法(可参考维基百科—各向异性扩散算法 http://en.wikipedia.org/wiki/Anisotropic_diffusion),迭代N2次,进一步的平滑文字轮廓。

可选地,所述N1优选为1,N2优选为10。

预处理效果,如图4所示,从图4中可以看出,文字轮廓上的锯齿状噪声被很好的消除 了,且笔画的断裂现象得到了一定程度的修复。

图5是本发明所述的文字骨架图,获取该文字骨架的具体步骤如下;

使用参考文献(WangC,LianZ,Tang Y,etal.Automatic Correspondence Finding for  Chinese Characters Using Graph Matching[C]//Image and Graphics (ICIG),2013 Seventh  International Conferenceon.IEEE,2013:545-550.)中的算法得到文字的骨架以及骨架上的关键 点,该算法包含以下几个步骤:

1)骨架提取算法,得到一个原始的骨架,也可参考网上的资料来实现 (http://blog.csdn.net/twowind/article/details/9094037);

2)骨架剪枝算法,剪枝的规则在参考文献中有详细的说明。

3)骨架的关键点检测,检测算法可使用常用的角点检测算法,可参考 (http://baike.baidu.com/link?url=oN6rV0c-58gdv0lNFwhf3uA9j1jeEpmm78wUIJd9lHF2wo_X1 G-Pf742ej9rdR8rn-BIQRxSSt8g86GyHSu4U_)。

图6是本发明所述的曲率极值点示意图,图7是根据骨架的关键点对极值点分类的效果 示意图,具体步骤如下:

1)使用边缘检测算法提取出文字的边缘轮廓及边缘轮廓上的所有点,即轮廓点,可采 用的边缘检测算法有Sobel算子,Canny算子等。

2)计算每个轮廓上的所有点的曲率(可参考百度百科—曲率 http://baike.baidu.com/link?url=w8FaAJGaDQsngI6VR9K8YdY63l3I2rx61iBxv1fdGIWcp8z7Pr0r7BscmIqPqge3),并找出所有的曲率极值点,如图6中轮廓上的黑色圆点所示。

3)为骨架中的每个关键点P(如图7中边缘轮廓内部的小圆点所示)划分一个半径为 DisT的圆形区域R。

4)DisT的值等于点P到最近d个轮廓点的平均距离,d为在关键点P在图像5中的八 邻域中的黑色像素点个数。这些值都可以通过算法自动计算得到,不需要预先设定。

5)在区域R内的极值点被选为角点(如图7中边缘轮廓上的大圆点所示),剩下的极 值点作为连接点。

6)对于角点和连接点组成的曲率极值点,使用加权的动态规划算法,根据参数筛选出 最优的轮廓分割点。

7)最优的轮廓分割点将轮廓划分为若干轮廓段,每个轮廓段都有两个端点,使用加权 的动态规划算法将轮廓段拟合为贝塞尔曲线。

8)如果轮廓段的两个端点都是连接点的话,误差阈值T1;否则,误差阈值T2。且 T1>T2,这就保证了,在角点的周围,算法会自动的保持更多的轮廓细节特征。

最优的轮廓分割点的筛选及曲线拟合具体包括以下步骤:

(a)曲率极值点将轮廓划分为若干轮廓段,每个轮廓段都有两个端点,枚举任意两 个轮廓分割点作为轮廓段的端点P[i],P[j],使用最小二乘法将轮廓段拟合为贝塞尔曲线, 并记录该轮廓段的最大拟合误差。如果该轮廓段的最大拟合误差小于阈值T,则可以使用一 条贝塞尔曲线对这段轮廓进行拟合,P[i+1]到P[j-1]的曲率极值点都可以被删除;否则不能 删除任何曲率极值点。该过程由动态规划算法实现,算法的主要流程如下:

1给定n个曲率极值点P[1]…P[n],这些点沿图像轮廓呈顺时针排列;

2dp[i][j]记录极值点P[i],P[j]所确定的轮廓段拟合时所需的曲线个数;

3初始化dp数组:枚举任意两个分割点P[i],P[j]

fori=1ton:

forj=i+1ton:

对P[i],P[j]确定的轮廓段进行曲线拟合,记录其最大拟合误差为M;

如果P[i]和P[j]都是连接点且M<T1,则dp[i][j]=1;

否则,如果M<T2,则dp[i][j]=1;

否则,dp[i][j]=j-i。

End

end

4动态规划过程伪代码:

forlen=1ton:

fori=1ton:

j=(i+len)%n

fork=i+1toj–1:

dp[i][j]=min(dp[i][j],dp[i][k]+dp[k][j]);

end

end

end

(b)如果轮廓段的两个端点都是连接点的话,误差阈值为T1;否则,误差阈值为T2。 且T1>T2,误差阈值越大,被删除的曲率极值点越多,轮廓的细节就被保留的越少。这就保 证了,在角点的周围,算法会自动的保持更多的轮廓细节特征。

图8是本发明所述的矢量化结果示意图。与输入的文字图像原图(图3)相比,本 系统的矢量化结果很好的保持了原字的特征,并且去除了轮廓上的细小噪声。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号