[发明专利]一种基于深度学习模型的人脸识别方法有效
申请号: | 201811250425.2 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109359608B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 林劼;钟德建;崔建鹏;马骏;马雨青;郝玉洁 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 模型 识别 方法 | ||
1.一种基于深度学习模型的人脸识别方法,其特征在于,包括:构建卷积神经网络、对网络参数进行训练、图片预处理和输入模型进行类别判定;
所述构建卷积神经网络,用于利用大规模人脸数据集进行改进的卷积深度神经网络构建;
所述构建卷积神经网络采用以下步骤:
A1:获得公开的人脸数据构建大规模人脸数据集;
A2:将所述数据集处理为固定大小为360*360的RGB图像,作为卷积神经网络的输入;
A3:输入图像通过一堆卷积层,卷积核大小为3*3;步长为1个像素;填充为1个像素;A4:空间池化由五个最大池化层进行,步长为2;网络最后是三个全连接层:最后一层是soft-max层;
A5:所有隐藏层都使用了一种改进的ReLU作为激活函数;
步骤A5对ReLU激活函数的改进,包括以下两方面:
改进参数正则化:首先用因子a、b重新参数化权重w,然后对因子而不是权重本身应用L2惩罚应用于w的重新参数化如下:
其中w是W的任何标量,a=[a1,a2,...,ai,...,ah],b=[b1,b2,...,bi,...,bh]代表在训练网络时要学习的两个k-dim向量而不是w;
在测试阶段,使用等于aTb的w进行预测;所述重新参数化仅在训练阶段增加成本;在重新参数化之后,a,b成为在训练阶段学习的参数;分解后的L2惩罚如下:
a和b的相应升级规则如下:
at,bt表示在第t次更新后属于网络的标量权重w的因子向量a和b,是通过链规则从较深层传播的梯度,λat和λbt表示正则化L(a,b)到a,b的梯度,η是动量参数,λ是表示正则化强度的权重衰减系数;
所述对网络参数进行训练,用于利用误差反向传播算法对神经网络参数进行训练;
所述图片预处理,用于基于MTCNN算法的人脸检测和人脸归一化处理,将图片转化成统一的特征向量表示;
所述输入模型进行类别判定,用于将特征向量输入训练好的卷积神经网络中进行类别标签判定。
2.根据权利要求1所述的一种基于深度学习模型的人脸识别方法,其特征在于,对卷积神经网络的训练包括以下子步骤:
B1:采用基于BP反向传播中的具有动量的小批量梯度下降法,使用优化多项式逻辑回归目标函数来进行训练;
B2:初始化网络权重;
B3:训练通过前面所述改进的ReLU中的权重衰减进行正则化。
3.根据权利要求2所述的一种基于深度学习模型的人脸识别方法,其特征在于:所述步骤B2中初始化网络权重包括以下子步骤:
B21:在神经网络中的前向传播期间,采用改进后的参数正则化:上述所述改进的ReLU中参数正则化,a,b需要满足:
B22:假设a中的ai是相互独立的并且共享相同的分布,b中的bi是相互独立的并且共享相同的分布,ai和bi也相互独立,得到:
B23:仍然无法对ai′和bi′进行明确的初始化,所以假设ai′和bi′共享相同的零均值高斯分布,这导致:
4.根据权利要求1所述的一种基于深度学习模型的人脸识别方法,其特征在于:所述图片预处理,包括以下子步骤:
C1:基于MTCNN算法进行人脸检测,得到人脸图像;
C2:利用几何归一化将C1得到的人脸图像处理为规范化的人脸图像;所述几何归一化,包括参数估计和仿射变换;
C3:将C2中处理后的人脸图像按像素转化成神经网络所需的360*360维的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811250425.2/1.html,转载请声明来源钻瓜专利网。