技术领域
本发明主要将面部识别技术用于生物遗传识别领域,具体来说涉及一种基于面部识别的遗传族群识别方法。
背景技术
人脸识别是基于人的脸部信息,进行身份识别的一种生物识别技术,人脸识别时首先判断是否存在人脸,若存在,则进一步给出人脸的大小、位置以及脸部的各个器官的信息,依据这些信息,进一步提取出人的特征、身份,并与已存在的人脸,进行匹配与识别。
主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。
1.基于几何特征的方法
人脸上的眼睛、鼻子、嘴巴、眉毛等,既是人们的共性,同时也是区分个体的关键(因为其大小、形状等不尽相同)。我们经常用面部的特征来描述个体,机器同样也可以做这件事。机器通过对图像处理,得到对这些图像的集合特征描述,比如根据鼻子的显著特点导出一组用于识别的特征度量如距离、角度等。
2.基于模板的方法
基于几何特征的方法,会导致一些局部特征信息的丢失。所以需要做出改进比如特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法等。特征脸法的基本思想,便是搜集大量的图像进行分析,寻找人脸图像分布的基本元素,即人脸图像样本集协方差矩阵的特征向量,以此近似地表征人脸图像。神经网络(又称人工神经网络),是一种运算模型,由大量的节点以及它们之间的联接构成。每个节点代表一个函数,而联接则代表权重。
3.基于模型的方法
有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。
其实不管人脸识别用那种方式,都离不开对人脸提取或者设置特征,然后将这些特征设置成基本参数,然后根据这些参数进行比较以及建模等进行最终的判断。
人脸识别主要用于设别一个人本身,但是我们知道在遗传学的角度上来说,父母与子女、兄弟姊妹在面相上是存在很多相同和相似的地方的。因此从理论上来说我们可以将人脸识别技术用于判断遗传关系。同样的,除开人类之外,对于动物来说,其同样存在遗传相似的问题,因此也可以将面部识别技术用于判断动物之间是否属于同一遗传族群。但现并没有相关的技术将人脸识别技术用于判断是否属于遗传族群。
发明目的
本发明的目的在于:将现有的人脸识别技术进一步扩大化应用,即对动物种群(包括人类)采用面部识别技术,用于判断是否属于同一遗传族群。
本发明的技术方案是这样实现的:基于面部识别的遗传族群识别方法,其特征在于,其步骤如下:
S1:确定样本:确定遗传抽样样本关系类型以及抽样对数M;
S2:确定面部识别参数:根据面部识别技术提取面部识别参数Fi,将面部设别参数组成集合A,即A={F
S3:确定识别标准:根据每个面部识别参数的不同,确定该参数在两个对象之间认定为相同的标准;
S4:去除非典型遗传参数:在上述面部识别参数中去除非典型遗传参数,剩余参数重新组成集合A,即A={F
S5:求出遗传相同系数:将上述全部M对抽样样本以集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每个面部识别参数有多少对样本相同,其值记为X
S6:判定具体样本是否相同:将上述第n对抽样样本以集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每对样本是否相同,若相同,其值记为1,若不同,其值记为0,即若将其值记为P
S7:计算样本遗传相似度:将集合B中的遗传相同系数和集合Cn中的数值案顺序分别相乘并除以识别参数个数得出每对样本的遗传相似度 D
S8:计算平均遗传相似度:以步骤S6和步骤S7同样的方式遍历全部M 对样本,均可以得出其遗传相似度值,将全部的值计入集合D,则 D={D
S9:判定区间划分:根据平均遗传相似度E的大小可以将区间[0,1]根据需要进行划分用于判定实际对象的遗传可能性;
S10:计算实际对象之间的相似度:将需要进行遗传判断的一对对象按照步骤S6和步骤S7相同的方式计算出其遗传相似度D
S11:判定:将D
S12:变更样本类型:变更遗传抽样样本关系类型,按照上述步骤S1 到步骤S11同样的方式可以计算出该类样本的平均遗传相似度E以及可以判定实际对象的遗传可能性。
进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,步骤S4去除非典型遗传参数的步骤如下:
S41:将上述全部M对抽样样本以步骤S2中的集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每个面部识别参数有多少对样本相同,其值记为X
S42:求出集合G中全部数值的平均值T,计算如公式(6);
S43:设定阈值
S44:若集合G中的数T
进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,步骤S4去除非典型遗传参数还包括步骤如下:
S45:设置对比样本,对比样本无十代之间血缘关系,对比样本个数为 N对;
S46:将上述全部N对对比样本以步骤S2中的集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每个面部识别参数有多少对样本相同,其值记为Y
S47:设定阈值
S48:若步骤S46中计算出的任一Y
进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,还包括计算优化平均遗传相似度E的方法,其步骤如下:
S101:在步骤S43中正整数m不变的情况下,将步骤S47中正整数n值遍历一遍,即将n从3到10之间的正整数全部取完,每取一个数n之后得到相应的阈值R
S102:在步骤S43中m改变成3到10中的另外一个数值,然后再按照步骤S101方法将步骤S47中正整数n值遍历一遍,即将n从3到10 之间的正整数全部取完,然后又得出8个平均遗传相似度E的值,将 m从3到10全部遍历完,一共可以得到64个平均遗传相似度E的值;S103:求出上述64个平均遗传相似度E的值的平均数,该值即为优化平均遗传相似度E值;
S104:将优化平均遗传相似度E值替换步骤S8中平均遗传相似度E。进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,还包括计算优化平均遗传相似度E的方法,其步骤如下:
S201:在步骤S43中正整数m不变的情况下,将步骤S47中正整数n 值遍历一遍,即将n从3到10之间的正整数全部取完,每取一个数 n之后得到相应的阈值R2再完成步骤S48,然后完成步骤S5到步骤 S8,然后就可以得到平均遗传相似度E,一共可以得到8个平均遗传相似度E的值;
S202:在步骤S43中m改变成3到10中的另外一个数值,然后再按照步骤S201方法将步骤S47中正整数n值遍历一遍,即将n从3到10 之间的正整数全部取完,然后又得出8个平均遗传相似度E的值,将 m从3到10全部遍历完,一共可以得到64个平均遗传相似度E的值;
S203:将上述64个平均遗传相似度E的值按照四舍五入的方法均保留2位小数;将上述64个平均遗传相似度E的值按大小分布在数轴上,然后将区间[0,1]按照0.05的步长平均分成20个区间,按照下列步骤找出优化平均遗传相似度E的值;
(i)如果有奇数个区间分布E值最多且分布数量相同,则以这些区间中最中间那个分布E值最多的区间为准,求出该区间中所有E值的平均数,该平均数即为优化平均遗传相似度E的值;
(ii)如果有偶数个区间分布E值最多且分布数量相同,则求出这些区间中最靠近一起的两个区间内的全部E值和这两个区间之间的其它区间的全部E值的平均数,该平均数即为优化平均遗传相似度E的值;
S204:将优化平均遗传相似度E值替换步骤S8中平均遗传相似度E。进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,步骤S9判定区间划分的具体方式如下:将判定区间划分为四个区间,分别为
进一步的,所述的基于面部识别的遗传族群识别方法,还可以是,步骤S9判定区间划分的具体方式如下:将判定区间划分为三个区间,分别为
应用上述方法可以求出关系样本的平均遗传相似度值,按照通常的遗传关系,遗传关系最近,那么两者长相最相同,其平均遗传相似度值也最高,从而我们可以根据这些数据进行判定两者是否属于二代、三代、四代等遗传关系,从而可以进一步判定两者是否属于同一遗传种族。
具体实施方式
本发明将现有的人脸识别技术进一步扩大化应用,即对动物族群 (包括人类)采用面部识别技术,用于判断是否属于同一遗传族群。因此我们可以按照如下步骤进行:
一、确定需要进行识别的遗传族群以及遗传抽样样本
由于动物在遗传特征上会遗传上一代的一些特征,因此我们可以根据这种相似度,利用面部识别技术进行判定之间是否存在遗传或者存在遗传的可能性。现有的人脸识别技术的识别度已经非常高,人类属于动物族群的一种,因此其实是可以将人脸识别技术用于动物,用于判断是否属于同一动物。因此本发明采用的是面部识别技术而不限于人脸识别。当然为了好说明,本文中具体实施例会在用人类以及人脸代替动物族群和面部识别。
动物族群的种族遗传是一个很大的研究面,具体研究的时候我们应该先明确属于哪个动物族群,比如人类、老虎、狮子等,不同的动物当然不能混在一起研究。我们以人类为例,先确定是人类,然后下一步我们需要确定的先要研究他们之间的什么关系,比如父子关系、父女关系、母子关系、兄妹关系、祖孙关系等。不同的关系,其在遗传上可能存在不同,因此我们的研究需要先分类,一个一个关系的研究。我们先以父子关系进行研究,为了需要,我们需要进行抽样,即抽样选定一定数量 (对)的父亲与儿子,我们可以把抽样的对数定为M对。当然从统计学的角度来说,抽样的数量越多,得到的结果就应该越准确。通常情况下,M应该不少于1000。
二、确定面部识别参数
对于人类来说,人脸上的眼睛、鼻子、嘴巴、眉毛等,既是人们的共性,同时也是区分个体的关键。同样的对于动物来说,其也存在一些识别的特征和共性。以人类来说,任何人脸识别技术都会将人脸的特征提取出来设置成一定的参数,然后根据这种参数进行比对,从而确定是否相同,最终根据全部特征的相似度来确定是否属于同一人。我们需要将现有的人脸识别技术中的面部识别参数提取出来,我们将这些参数定为Fi,然后全部参数组成集合A,即A={F
三、确定识别标准
对于识别参数来说,如果用于判断是否属于同一人,其标准可能就是是否完全相同。但对于用于判断抽样样本中的父子关系则不同,因为遗传,有些特征可能两者完全一致,有些特征可能略有差别,如果采用人脸识别中的判断是否同一人的标准则最终可能根本无法判断。因此有必要对样本中的判断标准进行重新确定,即确定两者相同或者相似的标准。举例来说,我们将两个眉毛之间的距离与眉毛到鼻尖的距离的比作为一个参数,由于该参数的值是具体明确的,那么我们需要确定的是,一对样本的中父本的该参数值与子本的该参数值差别在什么范围内可以认定为相同或者相似,比如在±10%范围内可以认定为相同或者相似。为了本文中好描述,下文中将上述参数中认定为相同或者相似的标准统一称为“相同”标准。
另外需要说明的是,面部识别参数中认定为相同的标准本身就是一个较大的课题,但其不是本发明的主要研究对象。本发明中可以根据以有的标准、经验来确定识别参数的相同标准。
四、去除非典型性遗传参数
在面部特征上起关键性作用的有5个基因,分别是PRDM16、PAX3、 TP63、C5orf50、COL17A1,它们通过控制头面部骨骼发育,包括额骨、上颌骨、下颌骨、颧骨、眶骨、鼻骨等,而这些骨骼的大小、高低和发育程度,决定着一个人的相貌。很显然,额骨、上颌骨、下颌骨、颧骨、眶骨、鼻骨等这些骨骼的大小、高低参数对于遗传起到重要作用。也就是说在遗传上有些参数非常重要,有些参数并不重要。
由于我们的参数来源于人脸识别技术,有些人脸识别参数或者说人脸特征对于识别是否属于同一人非常重要,但是对于从遗传学上对样本参数是否相同却并无太大作用。因此我们把这些参数在遗传上并无多大作用的参数称之为非典型遗传参数。我们在具体研究族群遗传时可以将该以上非典型遗传参数去掉,只研究典型遗传参数。在面部识别参数中去除非典型遗传参数,剩余参数重新可以组成集合A,即 A={F
五、求出遗传相同系数
在前面的准备做好之后,将上述全部M对抽样样本以集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每个面部识别参数有多少对样本相同,其值记为X
若抽样样本为1000对父子,遗传参数数量为100个,我们得出如下遗传系数表1:
则集合B={0.203,0.722,0.451,……,0.675,0.055}。
六、判定具体样本是否相同
将上述第n对抽样样本以集合A中的面部识别参数为顺序,按照步骤S3中确定的标准判定每对样本是否相同,若相同,其值记为1,若不同,其值记为0,即若将其值记为P
若将其中任意一对抽样样本比如第88对抽样样本进行上述方式判断,可以得出如下表2:
则集合C
七、计算样本遗传相似度
将集合B中的遗传相同系数和集合Cn中的数值案顺序分别相乘并除以识别参数个数得出每对样本的遗传相似度D
根据上面的数据D
八、计算平均遗传相似度
以步骤六和步骤七同样的方式遍历全部M对样本,均可以得出其遗传相似度值,将全部的值计入集合D,则D={D
D
九、判定区间划分
根据平均遗传相似度E的大小可以将区间[0,1]根据需要进行划分用于判定实际对象的遗传可能性。
比如可以将判定区间划分为四个区间,分别为
也可以根据需要将判定区间划分为三个区间,分别为
十、计算实际对象之间的相似度
做完上述工作后,我们就可以进行遗传判断了。我们将需要进行遗传判断是否为父子关系的一对对象按照步骤六和步骤七相同的方式计算出其遗传相似度D
十一、判定是否具有遗传关系
将D
需要说明的是,步骤九中区间的划分实际需要根据E的值的大小以及实际需要进行划分,其并不固定。同时由于其是统计数据,还需要与实际联系进行划分才能够更准确。
比如实际得出的E值为0.6,然后将许多对可能存在父子关系也可能不存在父子关系的样本用上述办法求出D
另外还需要注意,E值大小实际还和步骤三中确定面部识别参数有关。即如果改变面部识别参数中确定“相同”的标准,那么E值可能会发生一定的改变,我们可以调整面部识别参数中确定“相同”的标准,然后根据得出的不同的E的值与实际关系中的准确性来反推识别参数中确定“相同”的标准哪一个更准确。
十二、变更样本类型
我们在确定父子样本的平均遗传相似度E值后,就可以对实际样本进行判定是否存在父子关系。同样的方法,我们可以变换样本,按照上述步骤S1一到步骤十一同样的方式可以计算出该类样本的平均遗传相似度E,比如可以求出母子关系平均遗传相似度,可以求出兄妹关系平均遗传相似度,可以求出祖孙关系平均遗传相似度等等。按照通常的遗传关系,遗传关系最近,那么两者长相最相同,其平均遗传相似度值也最高,从而我们可以根据这些数据进行判定两者是否属于二代、三代、四代等遗传关系,从而可以进一步判定两者是否属于同一遗传种族。
十三、去除非典型遗传参数的最优方法
我们在步骤四中具体研究族群遗传时可以将非典型遗传参数去掉,只研究典型遗传参数,我们可以通过如下方式去除非典型遗传参数。
将上述全部M对抽样样本以步骤二中的集合A中的面部识别参数为顺序,按照步骤三中确定的标准判定每个面部识别参数有多少对样本相同,其值记为X
然后求出集合G中全部数值的平均值T,计算如公式(6);
这时我们可以设定一个阈值
阈值R
去除非典型遗传参数还可以采用如下方式:
设置对比样本,对比样本无十代之间遗传关系,对比样本个数为 N对;
将上述全部N对对比样本以步骤二中的集合A中的面部识别参数为顺序,按照步骤三中确定的标准判定每个面部识别参数有多少对样本相同,其值记为Y
这时设定阈值
若上述步骤中计算出的任一Y
十四、计算优化平均遗传相似度E的方法
按照步骤一到步骤八可以求平均遗传相似度E值。事实上,我们还可以将该值进行进一步的优化,具体如下:
设定的阈值
然后将设定的阈值
求出上述64个平均遗传相似度E的值的平均数,该值即为优化平均遗传相似度E值;我们可以用该优化平均遗传相似度E值替换原步骤八中的平均遗传相似度E。
上述计算优化平均遗传相似度E的方法,还可以进一步优化:
将上述64个平均遗传相似度E的值按照四舍五入的方法均保留2位小数;将上述64个平均遗传相似度E的值按大小分布在数轴上,然后将区间[0,1]按照0.05的步长平均分成20个区间,按照下列步骤找出优化平均遗传相似度E的值;
(1)如果有奇数个区间分布E值最多且分布数量相同,则以这些区间中最中间那个分布E值最多的区间为准,求出该区间中所有E 值的平均数,该平均数即为优化平均遗传相似度E的值;
(2)如果有偶数个区间分布E值最多且分布数量相同,则求出这些区间中最靠近一起的两个区间内的全部E值和这两个区间之间的其它区间的全部E值的平均数,该平均数即为优化平均遗传相似度 E的值。
当然上述根据平均值计算优化平均遗传相似度E值的方法只是其中一种方式,实际情况可以根据其它方式进行计算。
以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 基于遗传修正的模糊线性判别分析的面部识别方法。
机译: 面部识别方法,面部识别设备和计算机程序执行面部识别方法
机译: 面部识别方法,面部识别设备和执行面部识别方法的计算机程序