首页> 中国专利> 手写轨迹的检测、规范化和在线识别以及异常字根的收集

手写轨迹的检测、规范化和在线识别以及异常字根的收集

摘要

本发明涉及用于手写轨迹的检测、规范化和在线识别以及异常字根的收集的方法和装置。根据本公开一个实施例,提供了一种对字符的手写轨迹进行检测的方法,包括:基于预定的异常字根,对于手写轨迹的每一笔画,根据该笔画的几何特征进行第一判断,以判断是否该笔画是异常字根;如果不是,则进行第二判断,以判断是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。

著录项

  • 公开/公告号CN104008363A

    专利类型发明专利

  • 公开/公告日2014-08-27

    原文格式PDF

  • 申请/专利权人 佳能株式会社;

    申请/专利号CN201310202701.9

  • 发明设计人 许梅芳;李建杰;

    申请日2013-05-28

  • 分类号G06K9/00;G06K9/68;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人刘倜

  • 地址 日本东京

  • 入库时间 2023-12-17 01:00:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-01

    授权

    授权

  • 2014-09-24

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20130528

    实质审查的生效

  • 2014-08-27

    公开

    公开

说明书

技术领域

本公开涉及用于字符的手写轨迹的检测、规范化、以及在线识别 方法和装置,以及用于收集异常字根的方法和装置。

背景技术

以中文以及日文汉字(kanji)为代表的字符系统(其也被称为方 块字或象形文字(ideographic character))通常包含多个笔画 (stroke),其中的某些笔画或笔画组合常常被作为字根(radical) (例如但不限于,中文中的偏旁部首)。另外,某些字根可以与例如 相邻的笔画组成更高级别的字根。

象形文字之类的字符的书写通常要比以英文为代表的表音字符系 统要复杂得多。例如,中文(汉字)对于每一个字都具有标准的书写 方式(writing style),包括:笔画的数目、笔画的书写顺序(笔顺) 和方向,等等。

对于以中文(汉字)为代表的字符系统,键盘式的输入(到终端 设备,例如计算机、移动终端等)常常是麻烦和低效的。随着手写板 以及手机等便携式设备的普及,手写字符输入成为一种趋势。

然而,中文(汉字)字符众多,书写方式多样。并且,在书写时, 为了简化和快捷,很多人并不是严格遵循标准的书写方式,并且笔画 形状(stroke shape)和/或字根形状也可能发生变形,例如行书和草 书等。并且,对于一些字根,特别是由较少笔画构成的字根,为了书 写的便利,很多人会倾向于简化其书写,从而使得所写就的字根不符 合标准的书写方式。通常,可以将这样的不符合标准的书写方式(例 如,具有异常的笔画连接)的字根称为异常字根(abnormal radical)。 例如,图8B示出了异常字根的一个示例。因此,这对高准确率地识 别手写字符提出了挑战。

典型地,字符识别包括基于在线信息的在线识别和基于离线信息 的离线识别。字符识别通常使用字典,字典可以包括用于字符的标准 模板和/或基准模型。标准模板可以包括例如下列中的一项或多项:笔 画构成,笔画数量,笔画的位置(起止点坐标),其它参考点坐标, 等等。基准模型可以包括例如字符笔画的概率分布,笔画的起止点统 计信息等等。本领域中已知用于字符识别的多种字典以及多种标准模 板和/或基准模型。

在线识别将每一字符看作是笔移动(书写)的时间上的序列。也 就是说,将手写轨迹看作具有分离笔画指示的坐标点的序列。因此, 对于每一字符(文字),存在标准的序列,据此可以构造用于该字符 (文字)的基准模型(reference model)以用于在线识别。从而,可 以评估手写轨迹与用于在线识别的基准模型的匹配度,由此得到候选 字符。例如但不限于,该匹配度可以作为识别置信度。

由于在线识别是基于轨迹序列的匹配,而一些常用的弹性的序列 匹配方法(譬如隐马尔科夫模型(Hidden Markov Model,HMM)算 法、动态时间归整(Dynamic Time Warping,DTW)算法等)对变 形的字符具有较为鲁棒的匹配结果,因此即使对于形状变形了的字符, 也能够实现相对精确的输入的序列和基准序列(reference sequence) 之间的匹配。然而,在线识别对书写的顺序敏感,而书写顺序与笔画 的数目、笔画的书写顺序和方向(也即,书写方式)高度相关,其中 的变化很可能导致不准确的识别。

另外,与离线识别相比,某些在线书写信息易于提取,例如,笔 画的数目、笔画的书写顺序、每一笔画的书写方向。然而,由于笔画 的不同书写方式,字符的手写迹线的笔画的数目、笔画的书写顺序、 每一笔画的书写方向常常会发生变化。因而,书写方式的变化将影响 在线识别的识别性能。

对此,在现有技术中提出了一些在字符识别字典中记录书写方式 变化(原型)的方法,例如可以见:

现有技术文献1:Masaki N,Kaoru M所著“Collection of on-line  handwritten Japanese character pattern databases and their  analyses”,IJDAR(2004)7:69-81;

现有技术文献2:Akihito K,Masaki N所著“Prototype learning of  structured pattern representation applied to on-line recognition of  handwritten Japanese characters”,IJDAR(2007)10:101-112

现有技术文献3:US09/020838;

现有技术文献4:US13/214222。

在此,可以将每一种书写方式称为一种原型。在这些基于原型登 记的在线识别技术中,将在字典中记录同一字符的多个原型,每一原 型代表了一种书写方式。另一方面,对于基于统计的在线识别技术, 诸如HMM、神经网络技术等等,字典中要存储对于同一字符的不同 书写方式的更加复杂的统计模型,例如,HMM方法中的高斯密度分 量来表示概率分布。

因此,针对不同书写方式,需要登记各种书写方式变化(原型), 这通常需要复杂的计算和大得多的字典,这也意味着需要高的硬件成 本和/或较长的识别时间(识别响应时间)。另外,对于这种基于原型 登记的技术,其识别性能(例如,准确率)取决于训练样本的多样性。 换句而言之,其仅能识别训练样本中已有的书写方式变化。离线识别 从手写轨迹的图像提取笔画或笔画段的空间分布信息作为离线特征进 行匹配。其通常是在书写完成之后进行识别的,一般其不利用动态书 写信息(诸如,前述的笔画的数目、笔画的书写顺序(笔顺)和方向 等)。离线识别依赖于手写轨迹图像的空间特征,从而对于书写方式 的变化鲁棒。但是由于笔画形状的变形,离线识别的最佳候选(例如, 第一最佳候选)的识别准确率通常没有在线识别的高。并且为了对笔 画形状的变形鲁棒,离线识别需要高得多的处理能力和存储器成本, 否则难以实现与在线识别相当的准确率。

至少针对上述的部分或全部问题,提出了本发明。

发明内容

根据本公开一个方面,提供了一种对字符的手写轨迹进行检测的 方法和装置。所述方法包括:基于预定的异常字根,对于手写轨迹的 每一笔画,根据该笔画的几何特征进行第一判断,以判断是否该笔画 是异常字根;以及如果不是,则进行第二判断,以判断是否该笔画是 异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判 断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。

根据本公开一个方面,提供了一种对字符的手写轨迹进行规范化 的方法和装置。所述方法包括:根据前述的方法对字符的手写轨迹进 行检测;以及对所检测到的异常字根进行修正以使其符合对应的标准 字根的书写方式。

根据本公开一个方面,提供了一种手写字符在线识别方法和装置, 所述手写字符具有手写轨迹。所述方法包括:根据前述的方法对手写 字符的手写轨迹进行规范化;以及基于所述规范化后的手写轨迹,通 过在线识别来识别该手写字符。

根据本公开一个方面,提供了一种收集异常字根的方法和装置。 所述方法包括:获得非标准书写方式的字符手写轨迹及其对应的标准 字符;通过将所述非标准书写方式的字符手写轨迹与对应的标准字符 的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述 非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准 笔画相邻的一个或多个笔画;根据该非标准笔画集的几何特征,确定 该非标准笔画集是否被包含在其它字符的手写轨迹中;以及如果包含 该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集 确定为异常字根。

根据本公开一个方面,提供了一种针对书写者自适应的在线字符 识别方法和装置。所述方法包括:根据前述的方法收集异常字根;接 收所述书写者的字符手写轨迹;根据前述的方法对所接收的字符手写 轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。

根据本公开的实施例,可以以较低的成本(例如,较小的字典, 较低的计算处理能力)实现紧凑的高准确率的手写识别引擎。根据本 公开的实施例的方法或装置,对于书写方式的变化相比于现有技术更 加鲁棒。并且由于本发明基于字根级别的识别和/或书写方式规范化, 而不是如现有技术中那样基于笔画级别,而字根是可以在若干不同字 符之间共享的,因此可以降低或消除对训练样本的依赖性。此外,根 据本公开的实施例,对于笔画形状变形也更加鲁棒。与现有技术相比, 本发明可以实现对手写轨迹的更高准确率的识别,特别是,可以显著 改善对于第一(最佳)候选的识别准确率。

从下面参考附图的说明中,本发明的另外的特性、特征、和优点 将更加清楚。

附图说明

本申请包括附图,并且附图构成本申请的一部分,附图示出了本 公开的实施例并且与说明书一起用于解释本发明的原理。

图1是示出可以实现本公开的某些实施例的一种机器系统的硬件 配置的框图。

图2示意性地示出了根据本公开一个实施例的用于对字符的手写 轨迹进行检测的方法的流程图。

图3示意性地示出了根据本公开一个实施例的用于对字符的手写 轨迹进行检测的装置的示意框图。

图4示意性地示出了根据本公开一实施例的判断笔画或笔画的组 合是否是异常字根的示例处理过程的流程图。

图5示意性示出了根据本公开一实施例的收集异常字根的示例处 理过程的流程图。

图6示意性地示出了根据本公开一个实施例的检测非标准笔画的 示例处理过程的流程图。

图7示意性示出了根据本公开一个实施例的对字符的手写轨迹进 行规范化的装置的示意框图。

图8A示意性地示出了作为一个示例的手写字符的视图,图8B示 出了根据该示例的一个异常字根,图8C示出了对该异常字根的修正。

图9示意性地示出了根据本公开一个实施例的对异常字根进行修 正的处理过程的流程图。

图10A-10D示出了根据本公开的一个实例的异常字根,其角点、 其笔画连接点、和根据笔画连接点划分的笔画的例子。

图11示出了根据本公开一个实施例的手写字符在线识别装置的 示意框图。

图12示出了根据本公开一个实施例的收集异常字根的装置的示 意框图。

图13示出了根据本公开一个实施例的针对书写者自适应的在线 字符识别装置的示意框图。

具体实施方式

下面将参考附图详细描述本公开的实施例。

注意,在附图中类似的附图标记和字母表示类似的项,并且因此 一旦在一个附图中定义了一个项,则对于以后的附图无需再就该项进 行讨论。

图1是示出可以实现本发明实施例的机器(例如,计算机)系统 1000的硬件配置的框图。

如图1中所示,计算机系统包括计算机1110。计算机1110包括 经由系统总线1121连接的处理单元1120、系统存储器1130、固定非 易失性存储器接口1140、可移动非易失性存储器接口1150、用户输入 接口1160、网络接口1170、视频接口1190和输出外围接口1195。

系统存储器1130包括ROM(只读存储器)1131和RAM(随机 存取存储器)1132。BIOS(基本输入输出系统)1133驻留在ROM1131 中。操作系统1134、应用程序1135、其它程序模块1136和某些程序 数据1137驻留在RAM1132中。

诸如硬盘之类的固定非易失性存储器1141连接到固定非易失性 存储器接口1140。固定非易失性存储器1141例如可以存储操作系统 1144、应用程序1145、其它程序模块1146和某些程序数据1147。

诸如软盘驱动器1151和CD-ROM驱动器1155之类的可移动非 易失性存储器连接到可移动非易失性存储器接口1150。例如,软盘 1152可以被插入到软盘驱动器1151中,以及CD(光盘)1156可以 被插入到CD-ROM驱动器1155中。

诸如麦克风1161和键盘1162之类的输入设备被连接到用户输入 接口1160。计算机1110还可以包括手写输入单元(诸如,手写板) 1163,以用于接收用户输入的手写字符,所述手写字符可以具有手写 轨迹。

计算机1110可以通过网络接口1170连接到远程计算机1180。例 如,网络接口1170可以经由局域网1171连接到远程计算机1180。或 者,网络接口1170可以连接到调制解调器(调制器-解调器)1172, 以及调制解调器1172经由广域网1173连接到远程计算机1180。

远程计算机1180可以包括诸如硬盘之类的存储器1181,其存储 远程应用程序1185。

视频接口1190连接到监视器1191。

输出外围接口1195连接到打印机1196和扬声器1197。

图1所示的计算机系统仅仅是说明性的并且决不意图对本发明、 其应用或用途进行任何限制。

图1所示的计算机系统可以被实施于任何实施例,可作为独立计 算机,或者也可作为设备中的处理系统,可以移除一个或更多个不必 要的组件,也可以向其添加一个或更多个附加的组件。

图2示出了根据本公开一个实施例的用于对字符的手写轨迹进行 检测的方法的流程图。在该实施例中,在步骤S201,基于预定的异常 字根,对于手写轨迹的每一笔画,根据该笔画的几何特征判断(第一 判断)是否该笔画是异常字根。

在一个实现方式中,可以通过对多个书写者的多种书写方式进行 统计分析,预先针对每一字符(例如,常用汉字)定义可能的异常字 根,例如,具有异常笔画连接的字根,从而,形成预定的异常字根。 在另外的实现方式中,可以以例如自适应的方式收集异常字根。图5 示出了根据本公开一实施例的收集异常字根的处理过程的流程图,将 在稍后对其详细说明。可以在数据库或者字典等中存储所预先定义或 者收集的异常字根。

如果在步骤S201,判断该笔画是异常字根,则确定该笔画是异常 字根。如果不是,则判断(第二判断)是否该笔画是异常字根的一部 分并且其与相邻笔画的组合是异常字根(步骤S203)。如果是,则确 定该笔画是异常字根。如果不是,则确定该笔画不是异常字根。这里, 所述第二判断可以是基于该笔画的几何特征和所述相邻笔画的几何特 征进行的。

所述几何特征包括所述笔画或笔画的组合中的线段的长度、线段 的方向、以及线段的中点的坐标。在一个具体示例中,所述线段可以 是在所述笔画或笔画的组合中的角点处将该笔画或笔画的组合分隔而 成的多个(两个或更多个)线段。

图8A示意性地示出了作为一个示例的手写字符的视图。 显然,对其正确的识别将得到字符“位”。图8B示出了对于该手写 轨迹,一个可能的异常字根,是由一笔写成的

下表1以示例的方式示出了某些示例字符内的可能的异常字根。

表1

在本公开的一些优选示例中,在此仅仅检测低级别的字根,这样 的字根具有较小笔画数(例如,三笔(画)或者更少笔画)并且难以 进一步分解成更小字根。在实际书写中,这样的字根常常被写成连笔, 例如,被写成一笔或两笔,从而在识别时成为异常字根。因此,异常 字根也可以被称为具有异常笔画的字根。对于上述的低级别的异常字 根,其通常仅具有1个异常笔画。在这样的实施例中,在步骤S201, 可以判断是否该笔画是1笔画的异常字根。而在步骤S203中,可以判 断是否该笔画是二笔画的异常字根的一部分并且其与相邻笔画的组合 是二笔画的异常字根。本发明并不限于上述示例,例如也可以应用于 更多笔画的异常字根。

图3示意性地示出了根据本公开一个实施例的对字符的手写轨迹 进行检测的装置(也称作检测装置)300的示意框图。

如图所示,装置300包括处理单元301,其适于执行图2所示的 方法。在某些另外的实施例中,装置300还可以可选地包括手写输入 单元303,用于接收用户输入的字符的手写轨迹。

在某些另外的实施例中,所述装置300还可以包括适于进行前述 第一判断的第一判断单元(未示出),以及适于进行前述第二判断的 第二判断单元(未示出)。所述第一和第二判断单元可以被包括在处 理单元中作为其组件,或者,可以替代所述处理单元。

根据本公开的不同实施例,可以通过如图1所示的计算机系统来 实现图3所示的手写字符识别装置,也可以例如通过支持手写输入(例 如,具有触摸屏)的移动装置(在图中未示出)等来实现该手写字符 识别装置。

图4示意性地示出了根据本公开一个具体实例的判断笔画或笔画 的组合是否是异常字根的处理过程的流程图。图10A示出了对于字根 “口”的一种异常书写方式,其中该字根被以顺时针方向一笔写成。 以该字根(异常笔画)为例对图4进行说明。

对于该笔画,检测该笔画内的角点,并在所述角点处将该笔画分 成多个线段(步骤S401)。在该步骤,检测该笔画内的角点的方式可 以是多样的,并且也可以根据不同的笔画或字根而采取不同的方式。 例如,在一个实例中,可以将笔画中具有较大方向改变(例如,大于 50°)之处检测作为角点,如图10B所示。在角点处对笔画进行划分, 将该笔画划分为4个线段,如图10A所示。

针对每一线段,计算其几何特征(步骤S403)。这里,所述几何 特征可以包括(但不限于)下列中的至少一项:线段的长度、线段的 方向、以及线段的中点的坐标。

之后,可以根据所述几何特征确定所述多个线段是否与前述预先 定义的异常字根的线段对应(步骤S405)。例如,字根应当具 有两个近乎水平的线段和两个近乎垂直的线段。在一个实例中,当水 平线段的长度与该字根的边界框(即,包含整个该字根的最小外接框) 的宽度之间的比例大于一阈值(例如,0.75),并且垂直线段的长度 与该字根的边界框的高度之间的比例大于一阈值(例如,0.75)时, 认为存在对应。

在一个具体示例中,如果存在对应,就可以确定该笔画是异常字 根(S409)。在一个更加优选的示例中,在存在对应的情况下,还另 外评估所述多个线段之间的相互关系以确定是否与对应的异常字根的 线段的相互关系相符(步骤S407)。这里,所述相互关系可以包括(但 不限于)下列中的至少一项:所述多个线段之间的交叉角以及所述多 个线段之间的距离。例如,对于字根中的两个水平线段,两者 的交叉角应当小于阈值(例如,15°)。对于不同的异常字根,可以预 先定义不同的相互关系即阈值。如果相符,则确定该笔画是异常字根 (步骤S409)。

上述的处理过程同样适用于笔画的组合。也即,可以将笔画的组 合看作一个整体笔画,对其进行图4所示的处理。

图5示出了根据本公开一实施例的收集异常字根的处理过程的流 程图。在步骤S501,获得非标准书写方式的字符手写轨迹及其对应的 标准字符。通常,用户输入手写字符(其具有手写轨迹),并从字符 识别的多个候选字符中选择正确的识别字符。由此,可以根据用户对 手写输入的手写轨迹的选择来确定非标准书写方式的字符手写轨迹及 其对应的标准字符。例如,如果用户并未选择第一候选字符,则可以 确定该字符手写轨迹是非标准书写方式的,并以用户所选择的字符作 为对应的标准字符。应理解,本发明并不限于此。

在步骤S503中,通过将所述非标准书写方式的字符手写轨迹与对 应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画 集。这里,所述非标准笔画集至少包括一个非标准笔画,并且还能够 包括与该非标准笔画相邻的一个或多个笔画。

在步骤S505,根据该非标准笔画集的几何特征,确定该非标准笔 画集是否被包含在其它字符的手写轨迹中。所述几何特征至少包括有 关以该非标准笔画集中每一笔画的各角点分隔的各线段的信息。例如, 当非标准笔画集中仅包括一个非标准笔画时,所述几何特征至少包括 有关以该非标准笔画的各角点分隔的各线段的信息。所述线段的信息 可以包括下列中一项或多项:线段的起始点坐标、线段的长度、线段 的方向、线段的中点坐标、线段的角点坐标。所述几何特征还可以包 括所述各线段之间的相互关系。该相互关系例如可以包括:平行、相 交等等。

在步骤S507,如果包含该非标准笔画集的不同字符的数目大于一 阈值,则将该非标准笔画集确定为异常字根。该阈值可以例如是基于 统计分析预先定义的。

该处理过程还可以包括确定与所述异常字根对应的标准字根。在 一个示例性的实现方式中,可以计算以该非标准笔画集中每一笔画的 各角点分隔的各线段的每一组合与所述标准字符的标准模板中的标准 笔画的组合的匹配距离。然后选择该非标准笔画集的匹配距离最小的 线段组合作为对应的标准字根。在一个示例中,所述非标准笔画集仅 具有一个非标准笔画而不包括与该非标准笔画相邻的一个或多个笔 画。在这样的情况下,可以计算以该非标准笔画的各角点分隔的各线 段的每一组合与所述标准字符的标准模板中的每一标准笔画的匹配距 离。选择该非标准笔画的匹配距离最小的线段组合作为对应的标准字 根。

图6示意性地示出了根据本公开一个实施例的检测非标准笔画的 示例处理过程的流程图。在步骤S601,对于所述手写轨迹内的每一笔 画,生成该笔画的特征序列。这里,所述特征序列可以包括,例如, 笔画的起点坐标、终点坐标、以及各角点坐标。

在步骤S603,计算所述特征序列与对应的标准字符的标准模板中 的所有笔画的特征序列的匹配距离。所述匹配距离可以包括(但不限 于)城市距离。例如,假设与该笔画对应的4维特征向量为[x1,y1,x2, y2],标准字符的标准模板内的相应笔画的预先定义的特征向量为[x’1, y’1,x’2,y’2],则二者之间的城市距离(city distance)可以等于|x1-x1’|+ |y1-y1’|+|x2-x2’|+|y2-y2’|。然而,本发明并不限于此;例如,也可以使 用欧几里德距离等等。并且,在某些实例中,可以使用每一笔画的匹 配距离的平均值来作为该异常字根的匹配距离。

在步骤S605,如果对于该笔画的最小匹配距离大于预定的阈值, 则确定该笔画为非标准笔画。

图7示意性地示出了根据本公开一个实施例的对字符的手写轨迹 进行规范化的装置700的示意框图。装置700包括前述的检测装置 300,以检测异常字根。装置700还包括修正装置703,用于对所检测 到的异常字根进行修正以使其符合对应的标准字根的书写方式。

因此,根据该实施例,还公开了一种对字符的手写轨迹进行规范 化的方法,包括:根据前面参考图2-6所述的方法对字符的手写轨迹 进行检测;以及对所检测到的异常字根进行修正以使其符合对应的标 准字根的书写方式。

图9示出了根据本公开一个实施例的对异常字根进行修正的处理 过程的流程图。在该实施例中,对于每一检测的异常字根(如前所述, 其可以是笔画或者笔画的组合),执行下列操作。

检测该异常字根的角点(步骤S901)。这里检测角点的方法可以 与上面的步骤S401所描述的类似。接着,根据字根的标准书写方式选 择角点中的至少一个作为笔画连接点(步骤S903)。例如,对于图10A 所示的异常字根(其对应于“口”),其标准书写方式是3笔写成。 因此,根据其标准书写其有两个笔画连接点,如图10C所示。

然后,将该异常字根在所述笔画连接点处分离成笔画(步骤 S905)。对于图10A所示的异常字根,其被划分成3个笔画,如图10D 所示。

之后,根据标准书写方式重新排序每一分离的笔画中的轨迹点。 如图10D中所示,该异常字根的笔画2和3具有与标准书写方式相反 的书写方向,这可以通过例如笔画起始点以及另外的中点的坐标容易 地判断出。因此,对其轨迹点重新排序,以例如使其符合标准书写方 式。

另外,图10D所示笔画之间的书写顺序也不符合标准书写方式(例 如,标准书写方式为笔画3→笔画1→笔画2)。可选地,在这种情况 下,还可以根据标准书写方式重新排序所分离的笔画(S909),以例 如使其符合标准书写方式。

根据本公开的某些实施例,如果修正后的异常字根能够与相邻的 笔画组合形成更高级别的字根,则还可以根据该更高级别的字根的标 准书写方式对所述分离的笔画和所述相邻的笔画重新排序。

在此,以图8A的手写轨迹作为另一示例进行说明。假设 对于该手写轨迹,检测到如图8B中粗线所示的异常字根于是,可以对该手写轨迹的前述的异常字根进行修正。图8C 示出了根据该示例的修正,其中,异常字根被分别拆分为线 段(笔画)6和7。

图11示出了根据本公开一个实施例的手写字符在线识别装置 1100的示意框图。在线识别装置1100包括:对手写字符的手写轨迹 进行规范化的装置700;以及在线识别单元1101,适于基于所述规范 化后的手写轨迹,通过在线识别来识别该手写字符。

因此,本申请还公开了一种手写字符在线识别方法,包括:根据 前面所述的方法对手写字符的手写轨迹进行规范化;以及基于所述规 范化后的手写轨迹,通过在线识别来识别该手写字符。

图12示出了根据本公开一个实施例的收集异常字根的装置1200 的示意框图。装置1200可以执行例如前面参考图5和6所述的收集异 常字根的处理过程。根据一个具体实现方式,装置1200可以包括:获 取单元1201,其适于获得非标准书写方式的字符手写轨迹及其对应的 标准字符;检测单元1203,适于通过将所述非标准书写方式的字符手 写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到 非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并 且还能够包括与该非标准笔画相邻的一个或多个笔画;确定单元 1205,其适于根据该非标准笔画集的几何特征,确定该非标准笔画集 是否被包含在其它字符的手写轨迹中,以及如果包含该非标准笔画集 的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。

装置1200还可以包括标准字根确定单元,适于确定与所述异常字 根对应的标准字根。

图13示出了根据本公开一个实施例的针对书写者自适应的在线 字符识别装置1300的示意框图。装置1300可以包括如前所述的收集 异常字根的装置1200,适于收集异常字根;手写输入单元1301,适于 接收所述书写者的字符手写轨迹;以及如前所述的手写字符在线识别 装置1100,适于对所接收的字符手写轨迹进行识别,其中以所收集的 异常字根作为所述预定的异常字根。

因此,根据该实施例,还提供了一种针对书写者自适应的在线字 符识别方法,包括:根据如前所述的方法收集异常字根;接收所述书 写者的字符手写轨迹;根据如前所述的方法对所接收的字符手写轨迹 进行识别,其中以所收集的异常字根作为所述预定的异常字根。

根据本发明,可以以较低的成本实现对手写轨迹的更高准确率的 识别。另外,根据本发明的实施例的识别方法或装置,对于书写方式 的变化以及笔画形状变形相比于现有技术更加鲁棒。另外,还可以降 低或消除对训练样本的依赖性。

根据本发明,可以实现识别准确率(特别是,第一候选字符识别 准确率)高的紧凑的手写字符识别引擎,而无需复杂的大容量字典。 因此,这也降低了对硬件以及对计算等处理能力的要求。另外,本发 明对于具有在线识别模块(单元)不支持(也即,不能识别)的书写 方式变化的手写字符的识别尤其有效,识别准确率有极大改善。

发明人对来自50位日文书写者的444750个日文汉字样本进行了 实验。在该实验中,将25位书写者的书写数据作为学习样本,将其余 25位书写者的书写数据作为评价样本,并利用了小且快速的紧凑式的 在线识别模块,其中用于在线识别的字典为1402千字节(KB)。对 于该在线识别模块,由于其所不支持的书写方式,其不能正确识别这 些学习样本中4.8%的样本。

下表2示出了示例性的两组典型的异常字根,以及用根据本发明 一个实施例的方法(装置)和根据现有技术的不利用书写方式规范化 的方法对具有该异常字根的样本的第一(最佳)候选的识别准确率。

表2

由表2可见,根据现有技术的方法,对具有上述异常字根的手写 字符的识别准确率极低,而根据本发明,则对识别准确率有了极大的 提高。

下表3示出了对于表2中所示的异常字根,利用根据本发明一个 实施例的方法(装置)和根据现有技术的基于原型登记的方法对具有 所有样本的第一(最佳)候选的识别准确率以及所使用的字典大小的 比较。

表3

由表3可见,相比现有技术的方法,根据本发明,对具有异常字 根的手写轨迹的识别准确率有明显改善,并且显著降低了所使用的字 典的大小,从而可以降低对处理能力的要求。

根据本公开的另外的方面,本发明的手写字符识别装置可以被实 施为一种终端。本发明的手写字符识别方法也可以在终端中实施。所 终端可以是支持手写识别功能的任何设备(尤其是,电子设备),包 括但不限于,计算机、客户机、移动终端(例如,笔记本电脑、平板 电脑、移动电话、移动手持机、音乐播放器等等),等等。

应当理解,上述方法中,某些步骤、单元或装置可以合并成一个 步骤、单元或装置,或者,某些单个步骤、单元或装置可以拆分成若 干步骤、单元或装置。另外,本公开的实施例可以彼此自由组合而不 偏离本发明的精神和范围。

可以通过许多方式来实施本发明的方法和设备。例如,可以通过 软件、硬件、固件、或其任何组合来实施本发明的方法和设备。上述 的方法步骤的次序仅是说明性的,本发明的方法步骤不限于以上具体 描述的次序,除非以其他方式明确说明。此外,在一些实施例中,本 发明还可以被实施为记录在记录介质中的程序,其包括用于实现根据 本发明的方法的机器可读指令。因而,本发明还覆盖存储用于实现根 据本发明的方法的程序的记录介质。

已经通过示例的方式详细展示了本发明的一些具体实施例,但是 应当理解,上述示例仅意图是说明性的而不限制本发明的范围。还应 理解,可以对上述的实施例进行多种修改而不脱离如所附权利要求所 限定的本发明的范围和实质。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号