[发明专利]基于动态间隔损失函数和概率特征的视频人脸识别方法有效
申请号: | 202010166807.8 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111339988B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 柯逍;郑毅腾;朱敏琛 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 丘鸿超;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 间隔 损失 函数 概率 特征 视频 识别 方法 | ||
本发明涉及一种基于动态间隔损失函数和概率特征的视频人脸识别方法,包括以下步骤:步骤S1:通过人脸识别训练集训练识别网络;步骤S2:采用已训练的识别网络作为特征提取模块,并通过同一个训练集训练不确定性模块;步骤S3:利用学习到的不确定性作为特征的重要程度,对输入的视频特征集合进行聚合,得到聚合后的特征;步骤S4:采用互似然分数对聚合后的特征进行比对,完成最终的识别。该方法能够有效地对视频中的人脸进行识别。
技术领域
本发明涉及模式识别与计算机视觉领域,特别是一种基于动态间隔损失函数和概率特征的视频人脸识别方法。
背景技术
近些年来,深度卷积神经网络在计算机视觉领域取得了巨大的成功,而基于深度学习的人脸识别方法也利用了深度卷积神经网络在特征提取方面的优势,在公开数据集上不断创造新的记录并取得了很大的发展。此外,在各个计算机视觉会议里也有越来越多的研究者发表与人脸识别有关的论文。因为人脸识别具有广泛的应用领域与巨大的商业价值,学术界与工业界都在不断地探索新的人脸识别技术,近些年来,借助于深度学习与卷积神经网络在计算机视觉领域取得的重大突破,人脸识别算法在各个公开基准数据集上不断刷新纪录并在工业界产生了许多落地产品。
尽管人脸识别技术已经取得很大进步,在真实环境中还面临着许多挑战,如光照、姿态、遮挡、年龄等诸多因素都会影响人脸识别的性能。
发明内容
本发明的目的在于提供一种基于动态间隔损失函数和概率特征的视频人脸识别方法,该方法能够有效地对视频中的人脸进行识别。
为实现上述目的,本发明采用的技术方案是:一种基于动态间隔损失函数和概率特征的视频人脸识别方法,包括以下步骤:
步骤S1:通过人脸识别训练集训练识别网络;
步骤S2:采用已训练的识别网络作为特征提取模块,并通过同一个训练集训练不确定性模块;
步骤S3:利用学习到的不确定性作为特征的重要程度,对输入的视频特征集合进行聚合,得到聚合后的特征;
步骤S4:采用互似然分数对聚合后的特征进行比对,完成最终的识别。
进一步地,所述步骤S1具体包括以下步骤:
步骤S11:从网络上获取公开的人脸识别训练集,并获得训练数据的相关标注;
步骤S12:对人脸识别训练集中的人脸图像采用预训练的RetinaFace人脸检测模型输出人脸包围框和人脸关键点位置,并应用相似变换进行人脸对齐,对所有输入的人脸图像的像素值减去均值,并进行归一化;
步骤S13:采用18层的ResNet作为用于人脸深度特征抽取的网络模型,并将其中第一个7×7的卷积核以3个3×3的卷积核代替;同时,将第一个卷积层的步长设为1,使得最后一个特征图的输出大小保持为7×7;此外,将恒等映射所在路径设为步长为2的平均池化接上步长为1的1×1卷积,以防止信息损失;最后,采用大小为7×7的卷积层代替平均池化层,输出最终的人脸特征xi;
步骤S14:设D={d1,d2,...,dN}为测试集中的人脸图像,di为第i张人脸图像,E(·)为用于提取深度特征的深度卷积神经网络模型,xi=E(di)为第i张人脸图像对应的特征,将深度特征xi与最后一个全连接层W的第j列作点积,得到第j个类别的分数zi,j,并输入到Softmax激活函数中生成分类概率Pi,j,其计算公式如下:
其中C为总的类别数量,k为不同类别的下标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010166807.8/2.html,转载请声明来源钻瓜专利网。