首页> 中国专利> 一种基于三维卷积神经网络的活体人脸检测算法

一种基于三维卷积神经网络的活体人脸检测算法

摘要

一种基于三维卷积神经网络的活体人脸检测算法,为实现活体人脸检测,将训练图片预处理之后,进行人脸定位,再利用三维卷积神经网络学习连续帧图像的时空特征,然后,时空特征通过softmax(s函数)进行分类,从而完成真实人脸和伪装人脸的分类;本算法通过端到端结构提取的特征比人工设计的特征好,且提取出的时空特征有助于提高视频人脸伪装的检测效率,且具有一定的普适性。

著录项

  • 公开/公告号CN112395908A

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 天津大学青岛海洋技术研究院;

    申请/专利号CN201910745246.4

  • 申请日2019-08-13

  • 分类号G06K9/00(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 266200 山东省青岛市鳌山卫街道青岛蓝色硅谷核心区莱青路2-2号

  • 入库时间 2023-06-19 09:57:26

说明书

技术领域

本发明涉及人脸识别领域,尤其涉及一种基于三维卷积神经网络的活体人脸检测算法。

背景技术

近年来,随着科学技术的发展,生物特征信息的获取与伪造变得越来越容易,非法认证者可通过偷拍、录制一段合法认证者的视频来伪造合法认证者的人脸。如果人脸识别系统不具备这些假冒攻击的检测功能,这将给人脸识别系统的安全性带来威胁,同时也会阻碍人脸识别技术的推广应用。而通过活体人脸检测技术,可以有效辨别出合法认证者与非法入侵者。

活体人脸检测可看成二分类问题,即真实人脸和伪造人脸的分类问题,已有很多研究者对活体人脸检测做出研究,大致分为三类: 基于图像纹理信息进行分析、基于动作信息及逆行分析以及通过多特征融合进行分析。这些方法大多采用手工设计特征,利用照片在二次成像时造成的莫尔条带效应,将真实人脸图片和伪装人脸图片同时变换到频率域,在频率域中寻找莫尔条带效应的峰值,从而区分真实人脸和伪装人脸。但是这些方法由于均为手工设计的特征,只对某种类型的图片有较好的识别率,不具备普适性。

发明内容

针对现有技术存在的问题,本发明提出一种基于三维卷积神经网络的活体人脸检测算法,为实现活体人脸检测,将训练图片预处理之后,进行人脸定位,再利用三维卷积神经网络学习连续帧图像的时空特征,然后,时空特征通过softmax(s函数)进行分类,从而完成真实人脸和伪装人脸的分类;本算法通过端到端结构提取的特征比人工设计的特征好,且提取出的时空特征有助于提高视频人脸伪装的检测效率,且具有一定的普适性。

一种基于三维卷积神经网络的活体人脸检测算法,具体步骤为:

(1)图片预处理:

对原始图像做人脸定位,并分 5 个尺度裁剪图像,第一个尺度下的人脸图像即为最初检测到的人脸,第二、第三、第四、第五尺度下的人脸图像依次是第一尺度下人脸图像长宽的 1.4、1.8、2.2、2.6 倍最后统一归一化为 64×64 像素的图像;

(2)人脸定位:

图像数据库以视频方式给出,基于视频中人脸基本保持不变这一特点,为保证图像之间的连续性,只对视频的第一帧图像检测人脸,该视频剩余帧直接套用第一帧图像检测到人脸的矩形框;对于没有检测到人脸或检测质量不佳的图像,做手工处理;人脸检测通过标定人脸76个关键点定位人脸,并找到对应 X、Y 坐标轴的最大最小值,得到人脸的矩形框;

(3) 网络结构

针对活体人脸检测设计一个适用的网络结构,首先数据进入3D卷积层,并将卷积核的时间维度设计为3,每个卷积层之后使用非线性激活函数即Relu激活层,然后是3D池化层,重复三次,最后有三个全连接层,第一、第二两个全连接层的节点数均设置为4096个,后面紧跟抛弃层即Dropout 层,用于防止训练过程中出现过拟合现象,Dropout率被设置为0.3,由于活体人脸检测是二分类问题,最后一层全连接层的输出节点数设置为2个。

一种基于卷三维积神经网络的活体人脸检测方法,在训练 3D 卷积神经网络时,输入层输入连续的经过归一化的视频帧序列,利用 3D卷积神经网络学习连续帧图像的时间空间特征; 通过提取 3D 卷积神经网络最后全连接层学到的特征,训练 SOFTMAX 分类器,实现真实人脸和伪装人脸的分类。

附图说明

图1是基于三维卷积神经网络的活体人脸检测整体神经网络结构图;

图2是活体人脸检测流程框图。

具体实施方式

下面结合本发明中的附图,对本发明中的技术方案进行进一步清楚完整的描述:

一种基于三维卷积神经网络的活体人脸检测算法,具体步骤为:

(1)图片预处理:

对原始图像做人脸定位,并分 5 个尺度裁剪图像,第一个尺度下的人脸图像即为最初检测到的人脸,第二、第三、第四、第五尺度下的人脸图像依次是第一尺度下人脸图像长宽的 1.4、1.8、2.2、2.6 倍最后统一归一化为 64×64 像素的图像;

(2)人脸定位:

图像数据库以视频方式给出,基于视频中人脸基本保持不变这一特点,为保证图像之间的连续性,只对视频的第一帧图像检测人脸,该视频剩余帧直接套用第一帧图像检测到人脸的矩形框;对于没有检测到人脸或检测质量不佳的图像,做手工处理;人脸检测通过标定人脸76个关键点定位人脸,并找到对应 X、Y 坐标轴的最大最小值,得到人脸的矩形框;

(3) 网络结构

针对活体人脸检测设计一个适用的网络结构,首先数据进入3D卷积层,并将卷积核的时间维度设计为3,每个卷积层之后使用非线性激活函数即Relu激活层,然后是3D池化层,重复三次,最后有三个全连接层,第一、第二两个全连接层的节点数均设置为4096个,后面紧跟抛弃层即Dropout 层,用于防止训练过程中出现过拟合现象,Dropout率被设置为0.3,由于活体人脸检测是二分类问题,最后一层全连接层的输出节点数设置为2个。图2为算法的整体设计流程图再训练集视频进行训练之后,用于测试的测试集数据输入到网络中,判别真假。图2中的网络模型的细节如图1中所示,在网络模型的最后通过softmax函数输出真假人脸的概率,从而进行判别。

根据现有的数据集,可以采用ReplayAttack与CASIA数据集,ReplayAttack人脸伪装数据库由 1300 个 mov 格式的短视频组成。这些视频包含 50 个不同受试者在不同光照环境下( 统一人工光照和自然光) 录制的真实人脸、照片伪装、打印照片伪装和视频伪装人脸。三种不同伪装方式的录制又分为固定和手持两种情况。CASIA 人脸伪装数据库是由中国科学院生物研究中心制作的,由 600个avi 格式的短视频组成。数据库已经分配好了训练集和测试集,共包含有50个受试者,每一个受试者通过 3 种不同的分辨率( 低、中、高) 设备录制了真实人脸和 3 种不同方式( 扭转、剪切照片、视频伪装) 的伪装人脸,即每一受试者被录制了 12 个短视频( 3 个真实,9 个伪装) 。训练阶段采用 ReplayAttack的训练集和 CASIA 的验证集,测试阶段则采用 CASIA 的测试集; 反之,对于 CASIA 人脸伪装数据库,训练阶段采用 CASIA 的训练集的ReplayAttack 的验证集,测试阶段则采用ReplayAttack 的测试集,通过数据库的交叉测试,即用一个数据集训练分类器,再用另一个数据集测试其性能,这种测试方法非常符合现实应用,能够有效的检测出分类器的效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号