首页> 中国专利> 基于多阶段多通道注意力网络的人脸性别与年龄识别方法

基于多阶段多通道注意力网络的人脸性别与年龄识别方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法及系统，其方法包括：S1：使用人脸检测方法在输入图像中标定人脸坐标；并截取人脸区域；S2：利用人脸关键点检测方法，从人脸区域检测人脸关键点坐标；S3：利用仿射变换，校正人脸关键点坐标，得到校正后的人脸图像；S4：对校正后的人脸图像进行降噪，得到降噪后的人脸图像；S5：将降噪后的人脸图像，输入多阶段多通道注意力网络，输出预测的人物的性别与年龄。本发明的方法，采用多阶段回归的方式提取不同级别的特征共同作用于性别与年龄识别。同时，本发明还采用多个注意力模块加强重要特征的权重，提高网络对特征的提取、利用能力，并且采用多通道处理特征实现特征互补。

著录项

公开/公告号CN113283294A

专利类型发明专利
公开/公告日2021-08-20

原文格式PDF
申请/专利权人阳光暖果(北京)科技发展有限公司;
展开▼

申请/专利号CN202110403740.X
发明设计人不公告发明人;
展开▼

申请日2021-04-15
分类号G06K9/00(20060101);G06K9/40(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11251 北京科迪生专利代理有限责任公司;
代理人江亚平
地址 100083 北京市海淀区中关村东路18号A-2012
入库时间 2023-06-19 12:18:04

说明书

技术领域

本发明涉及人工智能计算机视觉领域，具体涉及一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法及系统。

背景技术

人脸相关的计算机视觉技术已有很多落地的项目，如常见的手机面部解锁、美颜相机等。人脸包含的信息十分丰富，不仅反映了人物的身份，还能从中得到人物的表情、年龄等信息。对于人类而言，可以轻松判断人物身份、表情、年龄等，但是如何使计算机准确识别这些信息是研究学者们努力攻克的难题。通过人脸图像分析得到人物性别与年龄的信息在实际应用中也有多方面的作用，人脸性别与年龄识别在人机交互、安防监控、商业决策等场景均有应用，也可对人脸识别算法起到辅助作用。

近些年深度学习推动着性别与年龄识别算法快速发展，精度不断提高，但是算法存在无法同时应用在性别识别和年龄识别、网络过于复杂、模型体积大无法应用于移动终端等问题。

发明内容

为了解决上述技术问题，本发明提供一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法及系统。

本发明技术解决方案为：一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法，包括：

步骤S1：使用人脸检测方法在输入图像中标定人脸坐标；并在输入图像中，根据人脸坐标，截取人脸区域；

步骤S2：利用人脸关键点检测方法，从人脸区域检测到人脸关键点坐标；

步骤S3：利用仿射变换，校正人脸关键点坐标，得到校正后的人脸图像；

步骤S4：对校正后的人脸图像进行降噪，得到降噪后的人脸图像；

步骤S5：将降噪后的人脸图像，输入多阶段多通道注意力网络，输出预测的人物的性别与年龄；其中，多阶段多通道注意力网络，设有K个阶段，每个阶段设有s

本发明与现有技术相比，具有以下优点：

本发明公开了一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法，采用多阶段回归的方式提取不同级别的特征共同作用于性别与年龄识别。同时，本发明还采用多个注意力模块加强重要特征的权重，提高网络对特征的提取、利用能力，并且采用多通道处理特征实现特征互补。本发明在不增加模型体积与计算时间的情况下提高了准确率，适合在移动终端、嵌入式平台使用该方法，该方法使用的网络参数量少、计算量小、模型体积小、计算时间短，满足了深度学习算法的轻量要求，可实现在移动设备上运行。

附图说明

图1为本发明实施例中一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法的流程图；

图2为本发明实施例中人脸关键点校正流程示意图；

图3本发明实施例中一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法中步骤S5：将降噪后的人脸图像，输入多阶段多通道注意力网络，输出预测的人物的性别与年龄，其中，多阶段多通道注意力网络，设有K个阶段，每个阶段设有s

图4本发明实施例中多阶段多通道注意力网络的结构示意图；

图5本发明实施例中一种基于多阶段多通道注意力网络的人脸性别与年龄识别系统的结构框图。

具体实施方式

本发明提供了一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法，采用多阶段回归的方式提取不同级别的特征共同作用于性别与年龄识别。同时，本发明还采用多个注意力模块加强重要特征的权重，提高网络对特征的提取、利用能力，并且采用多通道处理特征实现特征互补。

为了使本发明的目的、技术方案及优点更加清楚，以下通过具体实施，并结合附图，对本发明进一步详细说明。

实施例一

如图1所示，本发明实施例提供的一种基于多阶段多通道注意力网络的人脸性别与年龄识别，包括下述步骤：

步骤S1：使用人脸检测方法在输入图像中标定人脸坐标；并在输入图像中，根据人脸坐标，截取人脸区域；

步骤S2：利用人脸关键点检测方法，从人脸区域检测到人脸关键点坐标；

步骤S3：利用仿射变换，校正人脸关键点坐标，得到校正后的人脸图像；

步骤S4：对校正后的人脸图像进行降噪，得到降噪后的人脸图像；

在一个实施例中，上述步骤S1：使用人脸检测方法在输入图像中标定人脸坐标；并在输入图像中，根据人脸坐标，截取人脸区域。

本步骤中，可采用通用的人脸检测方法，在输入图像中标定人脸坐标，并根据该坐标，从输入图像中截取对应的人脸区域。

在一个实施例中，上述步骤S2：从人脸区域检测到人脸关键点坐标；具体包括：

双眼中心坐标、鼻尖坐标及嘴角坐标。

本步骤中，采用通用的人脸关键点检测方法，例如DCNN方法，检测可得到人脸的关键点坐标，此处的人脸关键点坐标包括：双眼中心坐标、鼻尖坐标及嘴角坐标。

在一个实施例中，上述步骤S3：利用仿射变换，校正人脸关键点坐标，得到校正后的人脸图像，具体包括：

将检测到的人脸关键点坐标，通过仿射变换，根据预先设置好的标准人脸关键点坐标进行对齐校正。

如图2所示，首先通过人脸检测，截取人脸区域，并在像素为60*60的图像中提前设置好标准人脸5个关键点的位置，将步骤S2中检测所得的关键点坐标与标准关键点坐标，通过仿射变换与之对齐，从而起到校正作用。

在一个实施例中，上述步骤S4：对校正后的人脸图像进行降噪，得到降噪后的人脸图像，具体包括：

对校正后的人脸图像，采用自适应中值法进行滤波降噪，得到降噪后的人脸图像。

在本步骤中，首先，将人脸图像切分为多个局部区域，分别对每个区域进行噪声检测，判断该局部区域的像素是否受到噪声污染并且计算该区域内受到污染的像素点个数，以此来描述该局部区域受污染的程度。然后，根据每个局部区域受污染的程度，采用自适应中值法，调整滤波窗口的大小来进行降噪。

在一个实施例中，上述步骤S5：将降噪后的人脸图像，输入多阶段多通道注意力网络，输出预测的人物的性别与年龄，其中，多阶段多通道注意力网络，设有K个阶段，每个阶段设有s

步骤S51：首先经过多阶段多通道注意力网络的第1阶段，将降噪后的人脸图像，同时输入两个特征构建块进行处理，分别得到的不同的特征，经过注意力模块进行融合，得到融合后的特征；其中，两个特征构建块均包括：卷积运算，批标准化，非线性激活以及池化操作；

本发明提供的多阶段多通道注意力网络设有K个阶段。首先在第1阶段，将上述步骤得到的降噪后的人脸图像，同时输入由两种不同的特征构建块构成的异构通道，对人脸图像的特征进行处理以及融合，得到融合后的特征。如图3所示，本发明实施例采用两个通道的特征构建块均由一个3×3的卷积运算、批标准化、非线性激活函数和一个2×2的池化层组成，不同的是在两个特征构建块中的激活函数分别使用ReLU函数和Tanh函数；池化层分别使用平均池化和最大池化。本发明实施例采用该设计的目的是使两个异构的通道得到不同的特征，以进行融合，使其具有更好的灵活性并且可以更好地获得互补的特征描述符，以提高整个神经网络的性能。

步骤S52：在多阶段多通道注意力网络的后K-1个阶段，将上一个阶段得到的特征，输入本阶段的多通道的聚合块，并融合本阶段的多通道聚合块输出的预测结果，得到本阶段的预测概率；其中，聚合块包括：特征提取模块和注意力模块；

如图3所示，本发明是实施例在第2、第3阶段的聚合块也采用两通道，分别对从第1阶段得到的特征进行处理，并输出本阶段的预测结果。不同阶段对输入数据的处理不同，高层次的阶段提取特征时采用比上一层更多的卷积操作，因此得到的特征也更加细致。同时，本发明实施例将每个阶段又分为s

本发明实施例中的注意力模块，是结合通道注意力模块及空间注意力模块，注意力机制的数学含义可以表示用下述公式(1)～(2)表示为：

O＝A(X) (1)

其中，X表示输入，A表示注意力网络，O表示注意力网络对原始输入操作后的输出；R为特征矩阵，

步骤S53；将多个阶段中每个小段的数据宽度与该小段预测概率的乘积之和，作为最终的预测结果，即输出预测的人物的性别与年龄。

最后，将多个阶段中每个小段的数据宽度与该小段预测概率的乘积之和，作为最终的预测结果，即输出预测的人物的性别与年龄。该图像最终的预测值用下述公式(3)表示：

其中，

本发明公开了一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法，采用多阶段回归的方式提取不同级别的特征共同作用于性别与年龄识别。同时，本发明还采用多个注意力模块加强重要特征的权重，提高网络对特征的提取、利用能力，并且采用多通道处理特征实现特征互补。本发明在几乎不增加模型体积与计算时间的情况下提高了准确率，适合在移动终端、嵌入式平台使用该方法网络参数量少、计算量小、模型体积小、计算时间短，满足了深度学习算法的轻量要求，可实现在移动设备上运行。

实施例二

如图5所示，本发明实施例提供了一种基于区块链的自动合成新闻的检测系统，包括下述模块：

人脸区域截取模块61，用于使用人脸检测方法在输入图像中标定人脸坐标；并在输入图像中，根据人脸坐标，截取人脸区域；

检测人脸关键点模块62，用于利用人脸关键点检测方法，从人脸区域检测到人脸关键点坐标；

校正人脸关键点模块63，用于利用仿射变换，校正人脸关键点坐标，得到校正后的人脸图像；

降噪模块64，用于对校正后的人脸图像进行降噪，得到降噪后的人脸图像；

人脸性别与年龄识别模块65，用于将降噪后的人脸图像，输入多阶段多通道注意力网络，输出预测的人物的性别与年龄；其中，多阶段多通道注意力网络，设有K个阶段，每个阶段设有s

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于多阶段多通道注意力网络的人脸性别与年龄识别方法 [P] . 中国专利： CN113283294A . 2021-08-20
2. 一种基于注意力机制融合的多通道卷积神经网络人脸表情识别方法 [P] . 中国专利： CN112329683A . 2021-02-05
3. HOME NETWORK SYSTEM USING FACE RECOGNITION BASED ON FEATURES AND FACE RECOGNITION METHOD USING SAME [P] . 韩国专利： KR20160072386A . 2016-06-23

机译：基于特征的人脸识别家庭网络系统和基于人脸的面孔识别方法
4. VOICE-BASED USER GENDER AND AGE RECOGNITION METHOD AND APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM [P] . WO2021218136A1 . 2021-11-04

机译：基于语音的用户性别和年龄识别方法和设备，计算机设备和存储介质
5. A method of simultaneous recognition for emotion age and gender based on users' voice signal [P] . 韩国专利： KR102106700B1 . 2020-05-28

机译：基于用户语音信号的情绪年龄和性别同时识别方法