[发明专利]一种人脸识别方法、装置及智能终端有效
申请号: | 202010191943.2 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111444802B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 米建勋;张健 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/82;G06K9/62;G06N3/08 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 马碧娜 |
地址: | 400000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 智能 终端 | ||
1.一种人脸识别方法,其特征在于,该方法包括以下步骤:
步骤1:采集清晰的已知人脸图像,提取人脸区域,缩放至同样大小,人工标记每一张人脸图像,且来自同一个体的人脸图像样本标记为一类,一个类别包含一个个体的一张或多张人脸图像,将所有人脸图像和其对应的类别标签作为训练集;
步骤2:将步骤1训练集中所有人脸图像均转化为向量形式,并进行L2范数归一化处理;相对应地,将训练集中每张人脸图像样本所对应的类别标签转化为0-1标签向量;
步骤3:构建可预测判别字典学习网络模型,该模型包括判别字典学习子模型和预测神经网络子模型
步骤4:结合步骤1和步骤2,将训练样本矩阵以及其对应的标签向量矩阵输入到步骤3中构建的可预测判别字典学习网络模型中,然后对该模型进行优化求解,学习该模型中的所需参数,保存所有学习得到的参数代入原始模型得到最终模型;
步骤5:在步骤4的过程中,同时利用自生成过采样方法生成虚拟训练样本用于训练预测神经网络子模型
步骤6:对于待识别图像,将待识别图像样本均转化向量形式,并进行L2范数归一化,利用上述获得的最终模型中的预测神经网络子模型计算出待识别图像样本的预测稀疏编码向量;
步骤7:将步骤4中获得的预测稀疏编码向量作为判别字典学习子模型的热启动值,通过判别字典学习子模型计算出待识别图像样本的最优稀疏编码向量;
步骤8:将步骤6中所得到的预测稀疏编码向量输入到分类器中,获得预测类别;将步骤7中所得到的最优稀疏编码向量输入到分类器中,获得最优类别;进而获取与待识别的人脸图像相匹配的清晰的人脸图像及其对应的身份信息,并输出待识别图像的人脸识别结果。
2.根据权利要求1所述的一种人脸识别方法,其特征在于,所述判别字典学习子模型S中的字典矩阵D每一列为一个字典项,D由两个子字典构成,其分别为通用描述字典Dde和标签字典Ddi,D,Dde与Ddi具有相同的行数,D的列数等于Dde与Ddi列数之和,Ddi的列数与类别数一致,Dde的列数取任意值,数学表达式记为D=[Dde,Ddi];对应的稀疏编码向量α为列向量,包含描述编码向量αu和类别标签编码向量αc,其中α的维数与D的列数一致,αu的维数与Dde的列数一致,αc的维数与Ddi的列数一致,数学表达式记为
3.根据权利要求2所述的一种人脸识别方法,其特征在于,在步骤3中构建的可预测判别字典学习网络模型如下:
其中,判别字典学习子模块为为预测神经网络子模块的参数集合,y为0-1标签向量,∈(αc,y)为标签编码与标签向量的残差值;x为单个样本向量,X为样本数据集全体,λ1,λ2,λ3为人工设置的超参数。
4.根据权利要求1或3所述的一种人脸识别方法,其特征在于,所述预测神经网络子模型的输入为人脸图像样本向量,输出为图像样本对应的预测稀疏编码;
对于所述可预测判别字典学习网络模型的参数,其初始值取值为服从高斯分布的随机值。
5.根据权利要求1所述的一种人脸识别方法,其特征在于,在步骤4中对所述可预测判别字典学习网络模型进行求解时,采用块坐标下降法进行优化,具体地,固定其中一个或多个系数,去求解剩下系数的最优值,经过反复迭代,以最终达到可预测判别字典学习网络模型收敛状态,或者达到预设的最大迭代次数为止。
6.根据权利要求1所述的一种人脸识别方法,其特征在于,在步骤5中,自生成过采样方法利用训练集样本对应的稀疏编码向量进行拆分组合,生成合理虚拟稀疏编码向量,并通过可预测判别字典学习网络模型中的判别字典学习子模型生成合理虚拟样本,并用于训练预测神经网络子模型
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191943.2/1.html,转载请声明来源钻瓜专利网。