[发明专利]基于多阶段多通道注意力网络的人脸性别与年龄识别方法在审
申请号: | 202110403740.X | 申请日: | 2021-04-15 |
公开(公告)号: | CN113283294A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 阳光暖果(北京)科技发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 江亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 阶段 通道 注意力 网络 性别 年龄 识别 方法 | ||
1.一种基于多阶段多通道注意力网络的人脸性别与年龄识别方法,其特征在于,包括:
步骤S1:使用人脸检测方法在输入图像中标定人脸坐标;并在所述输入图像中,根据所述人脸坐标,截取人脸区域;
步骤S2:利用人脸关键点检测方法,从所述人脸区域检测到人脸关键点坐标;
步骤S3:利用仿射变换,校正所述人脸关键点坐标,得到校正后的人脸图像;
步骤S4:对所述校正后的人脸图像进行降噪,得到降噪后的人脸图像;
步骤S5:将所述降噪后的人脸图像,输入多阶段多通道注意力网络,输出预测的人物的性别与年龄;其中,所述多阶段多通道注意力网络,设有K个阶段,每个所述阶段设有sk个小段。
2.根据权利要求1所述的基于多阶段多通道注意力网络的人脸性别与年龄识别方法,其特征在于,所述步骤S2中所述人脸关键点坐标,具体包括:
双眼中心坐标、鼻尖坐标及嘴角坐标。
3.根据权利要求1所述的基于多阶段多通道注意力网络的人脸性别与年龄识别方法,其特征在于,所述步骤S3:利用仿射变换,校正所述人脸关键点坐标,得到校正后的人脸图像,具体包括:
将检测到的所述人脸关键点坐标,通过仿射变换,根据预先设置好的标准人脸关键点坐标进行对齐校正。
4.根据权利要求1所述的基于多阶段多通道注意力网络的人脸性别与年龄识别方法,其特征在于,所述步骤S4:对所述校正后的人脸图像进行降噪,得到降噪后的人脸图像,具体包括:
对所述校正后的人脸图像,采用自适应中值法进行滤波降噪,得到降噪后的人脸图像。
5.根据权利要求1所述的基于多阶段多通道注意力网络的人脸性别与年龄识别方法,其特征在于,所述步骤S5:将所述降噪后的人脸图像,输入多阶段多通道注意力网络,输出预测的人物的性别与年龄;其中,所述多阶段多通道注意力网络,设有K个阶段,每个所述阶段设有sk个小段,具体包括:
步骤S51:首先经过所述多阶段多通道注意力网络的第1阶段,将所述降噪后的人脸图像,同时输入两个特征构建块进行处理,分别得到的不同的特征,经过注意力模块进行融合,得到融合后的特征;其中,两个所述特征构建块包括:卷积运算,批标准化,非线性激活以及池化层;
步骤S52:在所述多阶段多通道注意力网络的后K-1个阶段,将上一个阶段得到的所述特征,输入本阶段的多通道的聚合块,融合本阶段的多通道所述聚合块输出的预测结果,得到本阶段各个所述小段的预测概率;其中,所述聚合块包括:特征提取模块和注意力模块;
步骤S53;将多个阶段中每个所述小段的数据宽度与该小段预测概率的乘积之和,作为最终的预测结果,即输出预测的人物的性别与年龄。
6.一种基于多阶段多通道注意力网络的人脸性别与年龄识别系统,其特征在于,包括下述模块:
人脸区域截取模块,用于使用人脸检测方法在输入图像中标定人脸坐标;并在所述输入图像中,根据所述人脸坐标,截取人脸区域;
检测人脸关键点模块,用于利用人脸关键点检测方法,从所述人脸区域检测到人脸关键点坐标;
校正人脸关键点模块,用于利用仿射变换,校正所述人脸关键点坐标,得到校正后的人脸图像;
降噪模块,用于对所述校正后的人脸图像进行降噪,得到降噪后的人脸图像;
人脸性别与年龄识别模块,用于将所述降噪后的人脸图像,输入多阶段多通道注意力网络,输出预测的人物的性别与年龄;其中,所述多阶段多通道注意力网络,设有K个阶段,每个所述阶段设有sk个小段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光暖果(北京)科技发展有限公司,未经阳光暖果(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110403740.X/1.html,转载请声明来源钻瓜专利网。