首页> 中国专利> 计算机辅助甲骨拓片分期断代方法

计算机辅助甲骨拓片分期断代方法

摘要

一种计算机辅助甲骨拓片分期断代方法,主要由甲骨拓片的预处理、提取甲骨拓片特征向量、训练甲骨拓片分期断代分类器和基于贝叶斯分类的甲骨拓片分期断代四个部分组成。利用数字扫描仪甲骨拓片扫描成点阵位图,对图像进行二值化并去除噪点;通过数学形态学图像处理,获取甲骨拓片的外接矩形图、凸包图、特殊四边形图、骨架图、连通图和笔宽权值图,提取12种甲骨拓片特征向量;基于大量已人工断代的甲骨拓片的样本集合,训练甲骨拓片的朴素贝叶斯分类器;获取待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。本发明利用计算机辅助实现甲骨拓片的分期断代,具备定量化、自动化、系统化等特点。

著录项

  • 公开/公告号CN102592149A

    专利类型发明专利

  • 公开/公告日2012-07-18

    原文格式PDF

  • 申请/专利权人 徐州师范大学;

    申请/专利号CN201210000130.6

  • 发明设计人 酆格斐;顾绍通;杨亦鸣;

    申请日2012-01-04

  • 分类号G06K9/66;G06K9/54;

  • 代理机构南京经纬专利商标代理有限公司;

  • 代理人唐惠芬

  • 地址 221009 江苏省徐州市铜山新区上海路101号

  • 入库时间 2023-12-18 06:12:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-22

    未缴年费专利权终止 IPC(主分类):G06K9/66 授权公告日:20130522 终止日期:20160104 申请日:20120104

    专利权的终止

  • 2013-05-22

    授权

    授权

  • 2012-09-19

    实质审查的生效 IPC(主分类):G06K9/66 申请日:20120104

    实质审查的生效

  • 2012-07-18

    公开

    公开

说明书

技术领域

本发明领域涉及甲骨拓片分期断代研究,具体涉及基于计算机图像处理和识别技术的计算机辅助甲骨拓片断代方法。

背景技术

自甲骨文发现之日起,学者们就开始对其所属时代进行研究。甲骨拓片的分期断代研究,可将甲骨文所记载的内容变成重要的科学研究材料,现已成为甲骨学者必须掌握和研究的重要课题。

在甲骨文分期断代的研究中,罗振玉、王国维等学者最早提出“称谓”这一标准可以确定具体甲骨所属的确切王世,首先确定了殷墟并范围了甲骨文为商代晚期之物,为甲骨文本身时代的细化分奠定了基础。加拿大学者明义士结合西方考古学方法(字体的观察)和中国传统金石学方法(称谓的考订)判断甲骨时代,使孤立甲骨断代研究深入到对成批甲骨的断代整理。董作宾在《甲骨文断代研究例》中,提出“五期”分法和甲骨断代的“十项标准”,现已成为国内外甲骨学届研究中普遍使用和承认的基本方法。胡厚宣、陈梦家等学者在此基础上对甲骨分期提出的四期分法和九期分法,促使甲骨学分期断代研究逐步走向深入。

上述分期断代方法中的“十项标准”包括:世系、称谓、贞人、坑位、方国、人物、事类、文法、字形和书体。其中世系、称谓和贞人三位一体作为甲骨文字内容,是其分期断代的第一标准。然而,对于许多既无称谓也无贞人的甲骨拓片而言,则需要利用富有时代特征的字形、书体和钻凿等形态研究辅助甲骨分期断代。目前,对甲骨字形演变、书体作风和钻凿形态的时代特点的实践经验总结尚停留在人工方法的文字整理阶段,仅为部分经验丰富的甲骨学者所掌握,难以为计算机所识别而进行分期断代,缺乏规律性和系统性的计算机辅助方法供更多甲骨研究者在断代实践中综合利用。

发明内容

技术问题:本发明的目是克服已有技术中的不足之处提供一种计算机辅助甲骨拓片分期断代方法,通过现有的数学形态学图像处理,达到对甲骨文字形演变、书体作风以及钻凿形态的时代特征的计算机辅助定量化分析和分类,从而使分期断代更加直接客观、直接、智能和自动化。

技术方案:计算机辅助甲骨拓片分期断代方法,包括下列步骤:

a、甲骨拓片的预处理

(1)利用数字扫描仪将甲骨拓片扫描成点阵位图;

(2)通过计算机对图像进行二值化处理;

(3)去掉面积较小的连通域,得到去噪点后的甲骨拓片二值黑白图象;

b、提取甲骨拓片图像的特征向量

(1)获取去噪点后的甲骨拓片二值黑白图象的外接矩形,得到去外框图;

(2)对去外框图进行数学形态学图像处理,分别获取凸包图、特殊四边形图、骨架图、连通图和笔宽权值图;

(3)对获取的图像提取12种甲骨拓片特征向量;

c、训练甲骨拓片分期断代分类器

(1)利用已人工断代的甲骨拓片样本集合12种甲骨拓片特征向量进行分期断代的条件概率估计;

(2)根据12种甲骨拓片特征向量的条件概率估计训练朴素贝叶斯分类器,直至符合人工断代结果;

d、基于贝叶斯分类的分期断代

(1)使用训练过后的朴素贝叶斯分类器,对待分期断代的甲骨拓片进行分类;

(2)建立待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。

有益效果:由于采用了以上技术方案,本发明与现有技术相比,具有以下优势:

1、能够兼顾字形演变、书体作风和钻凿形态,可实现对既无称谓也无贞人的甲骨拓片,进行计算机辅助的定量化、自动化和系统化分期断代,大大降低了原本繁琐且难以掌握的人工分期断代方法的难度;

2、利用数学形态学方法,提取外接矩形图、凸包图、特殊四边形、骨架图、连通图,在此基础上分别提取12种甲骨拓片特征向量,更加本质的抓住了甲骨拓片字体的形态特征。

3、本发明基于贝叶斯分类的甲骨拓片分期断代方法,并基于大量已人工断代的甲骨拓片的样本集合,分别计算各特征因素对分期断代的条件概率(先验概率)估计,训练甲骨拓片的朴素贝叶斯分类器,获取待分期断代甲骨拓片与“五期”分法的映射关系,能得出比较符合人工分期断代的有效分类结果。

附图说明

图1是本发明计算机辅助甲骨拓片分期断代方法的实施例流程图。

图2是《甲骨文合集》(中华书局,1979-1983年)559(正面)视图。

图3(a)是甲骨拓片扫描后得到的点阵位图。

图3(b)是甲骨文字的二值黑白图像。

图3(c)是去除噪点后的甲骨文字二值图像。

图4是甲骨拓片特征向量的图像处理提取过程框图。

图5(a)是甲骨拓片字体的外接矩形图。

图5(b)是甲骨拓片字体的凸包图。

图5(c)是甲骨拓片字体的特殊四边形图。

图5(d)是甲骨拓片字体的骨架图。

图5(e)是甲骨拓片字体的连通图。

图5(f)是甲骨拓片字体的笔宽权值图。

图6是训练甲骨拓片分类器的流程图。

图7是基于贝叶斯分类的甲骨拓片分期断代系统的界面图。

具体实施方式

下面结合附图对本发明的一个实施例作进一步的描述:如图1所示,本发明的计算机辅助甲骨拓片分期断代方法主要由甲骨拓片的预处理、提取甲骨拓片特征向量、训练甲骨拓片分期断代分类器和基于贝叶斯分类的甲骨拓片分期断代四个部分组成。

甲骨拓片的预处理包括:利用数字扫描仪将甲骨拓片扫描成点阵位图;通过计算机对图像进行二值化处理;去掉面积较小的连通域,得到去噪点后的甲骨拓片二值黑白图象;如图2所示的甲骨拓片上多个甲骨文字,利用扫描仪以固定分辨率扫描成灰度图像,如图3(a)所示;通过字符切割得到单个的甲骨字体图像,利用迭代法将甲骨拓片图像二值化(以0表示黑像素即背景像素,1表示白像素即前景甲骨笔画像素)处理,如图3(b)所示;然后通过去掉面积较小的连通域的方法,对二值图像进行噪声消除,如图3(c)所示。

提取甲骨拓片图像的特征向量:获取去噪点后的甲骨拓片二值黑白图象的外接矩形,得到去外框图;对去外框图进行数学形态学图像处理,分别获取凸包图、特殊四边形图、骨架图、连通图和笔宽权值图;对获取的图像提取12种甲骨拓片特征向量;如图4所示,利用数学形态学图像处理方法分别提取甲骨拓片的视觉特征,依据甲骨拓片的字形演变、书体作风和钻凿形态等,将人工鉴定所用到的视觉特征转化为利用计算机语言去描述并抽取这些特征量。甲骨拓片特征向量的图像处理提取过程即为对单个甲骨拓片字体去噪声点后二值黑白图像进行图像处理,获取外接矩形并得到去外框图,依次进行凸包图、特殊四边形图、骨架图、连通图和笔宽权值图等图像处理过程。

训练甲骨拓片分期断代分类器:利用已人工断代的甲骨拓片样本集合12种甲骨拓片特征向量进行分期断代的条件概率估计;根据12种甲骨拓片特征向量的条件概率估计训练朴素贝叶斯分类器,直至符合人工断代结果;经过去外框图处理得到的单个甲骨字体的二值图像,如图5(a)所示,设以                                               表示单个甲骨字体的外接矩形,因是二值图像,故其取值非1即0,其中0是黑色表示非字体背景像素,而1是白色表示字体笔画前景像素。设该外接矩形图像的大小为:,其中为图像的水平像素数,为垂直像素数。则可分别抽取如下特征值:

1、外接矩形的宽高比例特征:是甲骨字体的偏平程度特征,定义为:

其中:作为图像的水平像素数,可表示甲骨拓片字体外接矩形的宽,作为图像的垂直像素数,为甲骨拓片字体外接矩形的高。

2、字体与外接矩形面积比,标识成:

表示甲骨拓片字体的实像素总和,而表示甲骨拓片外接矩形像素总和。

3、水平、垂直方向相对重心位置:

其中,,标识为甲骨拓片字体的水平、垂直相对重心,,分别是图像的水平重心位置和垂直中心位置。且有:

以单个甲骨拓片字体图像作为有限点集,找到字体点集中最右顶点,依照逆时针方向枚举出包含该点集中所有点的最小面积的凸多边形所有的顶点,作为甲骨拓片字体轮廓的凸包图,如图5(b)所示。设凸包按逆时针的个顶点,,…,,根据甲骨字体凸包图可以抽取特征:

4、字体与凸包面积比,定义为:

其中,表示单个甲骨拓片字体的凸包面积所有像素总和。

甲骨拓片字体图像具有丰富的边缘信息,除了上述外接矩形和凸包外,还有特殊四边形。设该特殊四边形中特殊的四个顶点分别是:最高点、最左点、最低点和最右点。这四个顶点组成一个不规则的四边形,如图5(c)所示,提取与之相关的特征有:

5、特殊四边形对角线上半部分所占比例,定义为:

其中,表示不规则的特殊四边形面积。

6、特殊四边形对角线左半部分所占比例,标识成:

7、特殊四边形对角线夹角的余弦值,定义为:

其中:和标识为特殊四边形对角线的一半所组成三角形的两条边,分别定义为,,是由最高点和最右点连接成的三角形的第三条边,存在,表示为和之间的夹角。

上述三个特征值一旦确定,甲骨拓片字体的特殊四边形的形状就确定了,且这三个特征值都具有大小不变性,所以这三个值能综合体现甲骨拓片字体外部形态。

另外,对单个甲骨拓片字体图形进行细化分段后,获取甲骨拓片字体的骨架图,如图5(d)所示,经过统计可以分别抽取:

8、笔画段数:经图像处理得到甲骨拓片字体的骨架图后,可以删除其所有的交叉点获取一系列分离的线段,统计分离线段的个数用以体现甲骨字体笔画的连笔特点。

9、最长的笔画段长与第二长的笔画段长比:对各个分离线段的长宽进行从大到小排序,将最长的笔画段长于第二长的进行对比反映甲骨字体笔画搭配比例的特点。

从单个甲骨拓片字体的连通图,如图5(e)所示,可以抽取:

10、字体独立连通块数:根据连通特性,直接统计一个甲骨拓片字体由多少个独立部分构成,也应用于体现甲骨拓片字体的连笔特性。

利用形态学的击中和击不中变换将甲骨拓片图像做细化处理,设细化后的笔宽权值图表示成,可以抽取特征:

11、笔画宽度特征,标识成:

其中,表示细化后的字体像素统计总和。通过笔画宽度特征获取单个甲骨拓片字体的笔宽权值图,如图5(f)所示,以此表现甲骨拓片字体的钻凿宽度变异特征。

如图6所示,基于朴素贝叶斯(Na?ve Bayes,NB)的甲骨拓片分类器训练流程,主要步骤如下所示:依据贝叶斯规则计算条件概率,分别计算五个分期断代类别的条件概率:,,…,并以最大化先验概率项作为甲骨拓片所属分期类别。

步骤1 设每个甲骨拓片样本均用一个12维特征向量来分别描述待分期断代甲骨拓片的12个特征属性的值,即特征向量为:,其中每个则对应表示为一个甲骨拓片的某个特征属性值。而将需要进行的“五期”断代,设置为类别集合,其中每个对应表示五个不同的甲骨分期断代类别。

步骤2选择一个已知分期断代的待分期甲骨拓片集合,以该集合作为训练样本集合,分别计算每个分期断代类别的五种状态的先验概率,,……。

步骤3针对训练样本集合中各个甲骨拓片的12个特征属性,分别统计各分期断代类别下各个特征属性的先验概率估计,即:

,,……;

,,……;

……;

,,……。

步骤4 因为分母对于所有类别为常数,因此将分子最大化,得到联合密度:

步骤5 由于各个甲骨拓片的特征属性的取值均是互相条件独立的,则可分别根据贝叶斯定理进行如下推导:

步骤6 将最大化后验概率的计算转化为最大化先验概率的计算,即有:,且满足。

基于贝叶斯分类的分期断代:使用训练过后的朴素贝叶斯分类器,对待分期断代的甲骨拓片进行分类;建立待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。基于贝叶斯分类的甲骨拓片分期断代系统界面,如图7所示,对待分期断代的甲骨拓片图像进行形态学处理,自动生成甲骨拓片图像的外接矩形图、凸包图、特殊四边形图、骨架图、连通图和笔宽权值图;在这些图像基础上分别提取单个待分期断代的甲骨拓片12个特征值;并基于前期训练过后的甲骨拓片的朴素贝叶斯分类器,对待分期断代的甲骨拓片进行分类;获取待分期断代甲骨拓片与“五期”分法之间的映射关系,实现对甲骨拓片图像的有效分类,可以辅助甲骨拓片分期断代。

上述实施例仅是用来说明本发明,而并非用作对本发明的限定,只要在本发明的实质内容范围内,对上述实施例的变换、变型都是本发明保护的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号