法律状态公告日
法律状态信息
法律状态
2017-08-25
未缴年费专利权终止 IPC(主分类):G06T3/00 授权公告日:20090826 终止日期:20160709 申请日:20070709
专利权的终止
2009-08-26
授权
授权
2008-03-05
实质审查的生效
实质审查的生效
2008-01-16
公开
公开
技术领域
本发明属于信息技术的汉字合成领域,特别是涉及一种基于最优全局仿射变换的汉字合成实现方法。
技术背景
汉字在信息时代暴露出了存储量大的弱点,这些弱点给汉字字库在各种电子产品中的使用增加了困难。采用分级汉字字库减小汉字图像存储量是一个可行的解决途径。但在汉字图像存储中,每个汉字都由几个部件构成,这些部件包括基本笔画、偏旁部首以及字元,基本笔画如一丨丿丶乚等,偏旁部首如艹钅亻犭纟等,字元如羽鬼仓田免等,许多的部件在不同的字中经常重复出现,所以在基本汉字部件库中只存储常用的部件,而每个汉字都通过这些部件来生成,从而达到减少存储量的目的。但是同一个部件在不同汉字中呈现不同的形态,如“攵”在“敖、悠”中,“木”在“林”,“树”,“枝”,“果”中,如何设计分级汉字字库及如何变换字库中的部件令其产生这些不同的形态至关重要。
现有技术包括将一个汉字分割成几块,再根据块间的比例将部件拼接起来;也包括根据汉字部件之间的结构将各种部件拼接起来,调整部件的比例结构从而达到较好的效果。这些方法都使用了部件的概念,但生成汉字时使用拼接的方法会使生成的汉字比较呆板。
在用部件生成汉字的时候,不仅需要将部件平移、缩放,还要形变,因此现有技术中还出现使用手动选点的仿射变换方法来构建基本汉字部件库,即在汉字和部件上手动地取对应的三点从而求出所需要的仿射变换参数。但是仅“楷体GB_2312”国标一级字库中就有3755个汉字,再加上字库中的五百多个部件,如果手动地选点,不仅人工工作量巨大,而且主观因素影响大,准确率不高,耗时耗力。
发明内容
本发明的目的在于克服现有技术的不足,使用最优全局仿射变换方法来构建基本汉字部件库,能够自动地匹配字库中的部件与汉字中对应部件的几何形状与位置并计算出仿射变换参数,在保证模拟结果的基础上既提高了效率,也提高了计算仿射变换参数的速度。
为了实现上述发明目的,采用的技术方案如下:
设计并采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字。基本汉字部件库由如下55个基本汉字部件图像组成:
用S表示基本汉字部件库中的部件,即源图像,R表示标准汉字图像相应的部件,即目标图像:
S={s1,s2,...,si,...,sm}
R={r1,r2,...,rj,...,rn) (1)
si是S的第i个黑象素点,rj是R的第j个黑象素点,点的排列顺序可以是任意的。则si经过全局仿射变换后对应的点si*为:
A,b为仿射变换参数,A为二维矩阵,b为二维列向量,则S经全局仿射变换变换之后的得到的合成汉字图像为
使S*和R的最近邻点距离的加权均值DNN最小化来求解仿射变换参数A和b,数学表示如式(2)所示
→Min for A,b
其中,
求解式(2)只需Φ对A和b同时求微分,得式(3)式(4)所示的方程组:
并将公式(3)两边同时求转置得到公式(5):
则由公式(4)和(5)组成公式(6)所示的方程组:
解方程组(6)即得仿射变换参数A,b如公式(7):
其中,公式(7)中的各参数如下所示:
上述述仿射变换参数的计算过程还包括最优的仿射变换参数计算,最优的仿射变换参数计算采用迭代的过程来得出最优的A和b,迭代过程采用S*代替公式(2)中的源图像S,当S*与基本汉字部件库中的目标图像R的距离不再减小时结束。最优的仿射变换参数AGAT和bGAT的具体迭代计算过程如下:
假设第i次迭代过程中得到的仿射变换参数为Ai和bi,第i次迭代后总的仿射变换参数为AiGAT和biGAT,则第n次迭代后的图像Sn*如下:
同时,
由公式(8)和(9)可得第n次迭代后总的仿射变换参数为:
当n=1时
为了得到较好的变换效果,计算仿射变换参数之前先对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理包括对齐两幅图像的重心、提取轮廓、骨架或者特征点,所述特征点包括轮廓上的拐点及端点。仿射变换仅仅在特征点上进行,这样有效的降低了计算复杂度。使用重心对齐方法可以改善模拟质量。本发明使用以图像结构作为评判中心的结构相似度评判方法来对组成合成汉字的各部件的结构关系是否合理,以及合成汉字是否美观进行判断。结构相似度评判方法具体实现如下:
分别用X={xi|i=1,2,...,N}和Y={yi|i=1,2,...,N}表示源图像和测试图像,则相似度Q的定义如公式(11)所示:
其中,
对于同一幅图像,不同区域的图像质量是有差异的,因此使用了滑动窗,如果滑动窗的数目是M,每个窗内的结构相似度为Qj,则整幅图像最终的结构相似度为:
本发明基于最优全局仿射变换方法构建的基本汉字部件库与真实汉字的变换关系,利于数量有限的基本部件库及仿射变换参数自动生成汉字,大大减少了字库的存储量,有着广泛的应用价值,如应用于掌上电脑、手机、嵌入式系统或单片机中,可以大大减少存储量需要的成本。
附图说明
图1为本发明以实施例的流程图;
图2为计算相似度的流程图。
具体实施方式
本发明并采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字。基本汉字部件库由如下55个基本汉字部件图像组成:
用S表示基本汉字部件库中的部件,即源图像,R表示标准汉字图像相应的部件,即目标图像:
S={s1,s2,...,si,...,sm}
R={r1,r2,...,rj,...,rn} (1)
si是S的第i个黑象素点,rj是R的第j个黑象素点,点的排列顺序可以是任意的。则si经过全局仿射变换后对应的点Si*为:
A,b为仿射变换参数,A为二维矩阵,b为二维列向量,则S经全局仿射变换变换之后的得到的合成汉字图像为
使S*和R的最近邻点距离的加权均值DNN最小化来求解仿射变换参数A和b,数学表示如式(2)所示
→Min forA,b
其中,
求解式(2)只需Φ对A和b同时求微分,得式(3)式(4)所示的方程组:
并将公式(3)两边同时求转置得到公式(5):
则由公式(4)和(5)组成公式(6)所示的方程组:
解方程组(6)即得仿射变换参数A,b如公式(7):
其中,公式(7)中的各参数如下所示:
上述述仿射变换参数的计算过程还包括最优的仿射变换参数计算,最优的仿射变换参数计算采用迭代的过程来得出最优的A和b,迭代过程采用S*代替公式(2)中的源图像S,当S*与基本汉字部件库中的目标图像R的距离不再减小时结束。最优的仿射变换参数AGAT和bGAT的具体迭代计算过程如下:
假设第i次迭代过程中得到的仿射变换参数为Ai和bi,第i次迭代后总的仿射变换参数为AiGAT和biGAT,则第n次迭代后的图像Sn*如下:
同时,
由公式(8)和(9)可得第n次迭代后总的仿射变换参数为:
当n=1时
本发明在计算仿射变换参数之前先对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理包括提取轮廓、骨架或者特征点,所述特征点包括轮廓上的拐点及端点。由于GAT变换需要遍历汉字图像上的每个点,实施例中在计算仿射变换参数之前先对源图像以及目标图像进行预处理:提取轮廓、骨架或者特征点(轮廓上的拐点及端点),这些预处理并未改变汉字和部件的基本形状,因此对仿射变换参数影响不大,但却提高了计算参数的速度,此方法称之为SGAT。
采用SGAT合成汉字的结果往往并不理想,特别是SGAT对单笔画基本上没有模拟能力,因此有必要对SGAT做一些改进。本实施例在SGAT迭代过程中,对源图像以及目标图像增加一个处理:对齐两幅图像的重心。即预处理包括提取轮廓、骨架或者特征点、对齐两幅图像的重心,所述特征点包括轮廓上的拐点及端点。本实施例将包括有对齐两幅图像的重心的方法称之为IGAT,通过IGAT对齐图像的重心之后,提高了汉字与部件最近邻点的正确匹配率,因此能够得到更好的仿射变换参数,但是对于汉字本身就是部件的汉字来说,由于重心计算误差,对齐重心的操作有时反而会使合成汉字与标准汉字出现位移上的偏差。因此为了每个汉字取得最优的仿射变换参数,在每次迭代过程中,都在SGAT(不对齐图像重心)和IGAT(对齐图像重心)所得到的参数中选择最优的参数,本文将该方法称之为NGAT,如附图2所示,将原图像及目标图像进行提取轮廓、骨架或者特征点的预处理后,分别通过SGAT和IGAT计算仿射变换参数,然后根据不同的汉字在迭代过程中选择最优的参数。
本实施例还使用结构相似度评判方法来对组成合成汉字的各部件的结构关系是否合理,以及合成汉字是否美观进行判断,结构相似度评判方法以图像结构做为评判中心的。
所述结构相似度评判方法具体实现如下:
分别用X={xi|i=1,2,...,N}和Y={yi|i=1,2,...,N}表示源图像和测试图像,则相似度Q的定义如公式(11)所示:
其中,
为了更加清楚的理解Q的含义,对Q进行了简单的改写:
Q的第一项表示X和Y之间的线性关系,当yi=axi+b(i=1,2,....N,a,b为常数且a>0)时,该项为1;第二项表示X和Y的亮度关系,当
对于同一幅图像,不同区域的图像质量是有差异的,因此使用了滑动窗,如果滑动窗的数目是M,每个窗内的结构相似度为Qj,则整幅图像最终的结构相似度为:
Q的定义式(12)中含有分母,对于二值化的汉字当使用滑动窗的时候,Q的分母很可能为0,因此本发明针对Q的计算问题进行了推导:
(1)只要不用“0”表示图像的特征,即可保证式(11)中
(2)当
本实施例比较了各种仿射变换方法和预处理计算仿射变换参数所需要的时间,如表1所示:
表1.(单位ms):各种仿射变换和预处理计算参数所用时间(SPH:手动选点,C:轮廓,S:骨架,F:特征点)
从表1中可以看出:
(1)对于三种不同的预处理(轮廓、骨架和特征点),无论是SGAT还是NGAT,特征点都具有明显的优势。这是因为特征点数远远少于轮廓和骨架的点数,大大降低了计算复杂度,提高了计算速度。
(2)当采用特征点时,SGAT和NGAT所用时间都远远少于手动选点的时间,甚至相差数十倍之多。
(3)当采用特征点时,NGAT具有和SGAT相当的时间性能。但是NGAT的模拟效果是SGAT无法比拟的。
本实施例在计算合成汉字和标准汉字的结构相似度时采用4*4的滑动窗,先对手动选点方法的国标一级字库的3755个“楷体GB_2312”的合成汉字进行评判,并把汉字按模拟效果从好到坏进行排序,为了说明NGAT的有效性,本文从前面模拟效果较好的1900个字中以50个汉字为间隔共取38个汉字,后面模拟效果较差的以25个为间隔共取74个汉字,最后5个最差的全选,最终得到117个汉字作为实验样本,这些样本的各种方法的平均结构相似度如表2所示:
表2:各种方法的平均结构相似度
从表2可看出当采用特征点时,NGAT的平均结构相似度基本等于手动选点的,但是NGAT自动的点匹配以及高计算速度是手动选点方法无法企及的。
本发明利用GAT得到的仿射变换参数变换分级字库中的部件,并将部件组成汉字,并使用以图像结构做为评判中心的结构相似度评判方法,而不是简单的象素点的比对,这更加适应于评判由分级字库组成的合成汉字。本发明利用55种基本部件图像及相应的仿射变换,可以合成任意汉字,实际应用时只需要存储55种基本部件图像及仿射变换参数,而不需要对每个汉字的图像进行存储,使得汉字存储量大大减少。
机译: 基于移动通信终端的呼叫中断信息的最优收益设备及其控制方法,一种包括该设备的系统,该系统能够考虑移动通信终端的用户模式来实现最优收益
机译: 基于全局最优化的无掩模光刻光栅化方法,计算机可读介质和装置
机译: 基于全局最优和贪婪启发式的访问结构选择方法