[发明专利]基于级联卷积神经网络的面部识别方法及装置在审
申请号: | 201811516718.0 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109657591A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 魏亚东;吴云霞;陈瀚 | 申请(专利权)人: | 东莞理工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 潘桂生 |
地址: | 523000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 面部识别 目标图像 级联 边界框 向量 校准 回归 方法使用 候选窗口 面部图像 关键点 去除 | ||
本发明涉及一种基于级联卷积神经网络的面部识别方法及装置。本发明所述的基于级联卷积神经网络的面部识别方法,包括如下步骤:将目标图像输入第一卷积神经网络,获取候选面部窗口和边界框回归向量,并利用所述边界框回归向量校准所述候选面部窗口,去除重叠候选窗口,获取包括候选面部窗口的目标图像;将包括所述候选面部窗口的目标图像输入第二卷积神经网络,利用所述边界框回归向量校准所述候选面部窗口,获取进一步处理后的目标图像;将进一步处理后的目标图像输入第三卷积神经网络,获取包括五个面部关键点定位的面部图像。本发明所述的基于级联卷积神经网络的面部识别方法使用轻量级卷积神经网络框架,能显著改善面部识别效果。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种基于级联卷积神经网络的面部识别方法及装置。
背景技术
面部识别是在图像中定位人脸的过程。人脸检测方法主要包括模板匹配、子空间方法和变形模板匹配等,还包括基于数学驱动的学习方法,如统计模型方法、神经网络学习方法、统计知识理论和支持向量机方法、基于马尔科夫随机域的方法等。但是,上述方法在光线明暗变换不稳定的情况下,面部识别会受到严重干扰,从而影响面部识别的准确性。对于神经网络学习方法,仅仅简单的增加网络的复杂程度,会遇到很多问题,例如:过拟合问题,还有网络退化问题,但是网络结构过于简单,又会遇到欠拟合问题。
发明内容
基于此,本发明的目的在于,提供一种基于级联卷积神经网络的面部识别方法,其使用轻量级卷积神经网络框架,能显著改善面部识别效果。
本发明是通过如下方案实现的:
一种基于级联卷积神经网络的面部识别方法,其特征在于,包括如下步骤:
将目标图像输入第一卷积神经网络,获取候选面部窗口和边界框回归向量,并利用所述边界框回归向量校准所述候选面部窗口,去除重叠候选窗口,获取包括候选面部窗口的目标图像;
将包括所述候选面部窗口的目标图像输入第二卷积神经网络,利用所述边界框回归向量校准所述候选面部窗口,去除重叠候选窗口,获取进一步处理后的目标图像;
将进一步处理后的目标图像输入第三卷积神经网络,去除重叠候选窗口,获取包括五个面部关键点定位的面部图像。
本发明所述的基于级联卷积神经网络的面部识别方法,使用三个轻量级的卷积神经网络组成级联卷积神经网络,并在每个神经网络中分别进行面部分类、边界框回归以及面部关键点定位,能显著改善面部识别效果。
在一种实施例中,所述第一卷积神经网络包括依次连接的大小为3*3的卷积层、池化层和全连接层,其中,在卷积层和全连接层后分别使用RELU函数作为非线性激励函数。
在一种实施例中,所述第二卷积神经网络包括依次连接的两个大小为3*3的卷积层和全连接层,其中,在每个卷积层和全连接层后分别使用RELU函数作为非线性激励函数。
在一种实施例中,所述第三卷积神经网络包括依次连接的三个大小为3*3的卷积层、池化层和全连接层,其中,在每个卷积层、池化层和全连接层后分别使用RELU函数作为非线性激励函数。
在一种实施例中,所述第一卷积神经网络的学习目标为两级分类,对于每个样本,采用交叉熵损失。
在一种实施例中,所述第二卷积神经网络的学习目标为边界框回归,对于每个候选面部窗口,预测其与最接近的边界框的真值之间的偏移量。
在一种实施例中,所述第三卷积神经网络的学习目标为面部关键点定位,将面部关键点定位公式化为回归问题,并将欧几里得损失最小化。
进一步地,本发明还提供一种基于级联卷积神经网络的面部识别装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞理工学院,未经东莞理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811516718.0/2.html,转载请声明来源钻瓜专利网。