[发明专利]一种基于深度学习和空间转换网络的多角度人脸识别方法有效
申请号: | 202011095551.2 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112232184B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 张晖;赵上辉;赵海涛;孙雁飞;朱洪波 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/82;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 空间 转换 网络 角度 识别 方法 | ||
本发明公开了一种基于深度学习和空间转换网络的多角度人脸识别方法,首先,构建卷积神经网络模型,改进其损失函数,并用预先获取的图片对模型进行训练;其次,基于空间转换网络的人脸对齐:利用变换矩阵对预先获取的图片进行数据采集并生成与模板相同角度大小的对应人脸;最后,基于YOLOV2对人脸进行检测。本发明通过在海量的人脸数据上进行训练提取泛化的人脸特征表示,突出特征之间的可区分度,使人脸识别准确度显著提高,可以发展为自然非配合场景下的人脸识别;且本发明能将人脸对齐和人脸识别网络统一起来,构成一个端到端的学习系统,极大地提高了人脸对齐的灵活性。
技术领域
本发明属于人工智能人脸识别领域,涉及在多角度情况下对人脸的判定,具体涉及一种基于深度学习和空间转换网络的多角度人脸识别方法。
背景技术
人脸识别能够根据人脸图像获取对应人物的身份信息。人脸识别因为其方便快捷的易用性和普遍性,在金融、刑侦和国防等领域有着广泛的应用。由于深度学习的迅猛发展,使得人脸识别技术不断普遍化,获得了学术界的广泛关注。随着计算机性能提升和数据库的增多,人脸识别的的精度已经不断地增高,目前最高的准确率已经接近100%,但这并不意味着人脸识别的问题已经完全解决,仍然在很多方面存在问题。
人脸识别系统由三个部分组成,分别是人脸对齐,人脸特征提取和人脸检测。在这三个部分中,人脸对齐起到的是数据预处理的步骤,在整个系统中起到重要的作用,目的是减少人脸姿态的多样性带来的特征变化,能便于系统识别固定人脸。这种人脸对齐目前存在两个问题,第一是对特征点的准确性很依赖,由偏差或者没检测出特征点都会极大的影响对其的效果。训练一个性能优秀的特征点检测网络需要大量特征点数据,收集这样的数据库成本十分巨大。第二是固定的几何形状的对齐方式会产生人脸几何信息的失真。这种信息的丢失对于某些重要的人来说是非常严重的。在大规模人脸识别场景下,由于光照和姿态等不确定因素带来的人脸差异,很难定义一个固定的集和模板来适应所有的状态。目前,运用子网络来学习图片的变换参数成为研究的热点,其中关键技术是空间转换网络,运用网络自适应的学习能力,以多姿态人脸(例如侧脸,低头等)为输入,生成并输出一张正面人脸图像,解决大姿态场景下一些大角度图片无法对齐的问题。
多角度人脸识别一般分为两种:一种是用人脸矫正的方法生成衣服正面人脸,在此基础上用人脸识别的方法,另一种是在不同角度的人脸上用CNN模型提取特征。到目前为止,深度学习在人脸检测和多角度人脸识别方面取得巨大进展。其中YOLO(You Only LookOnce)是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。
发明内容
发明目的:本发明提出一种基于深度学习和空间转换网络的多角度人脸识别方法,通过在海量的人脸数据上进行训练提取泛化的人脸特征表示,突出特征之间的可区分度,使人脸识别准确度显著提高。
发明内容:
(1)构建卷积神经网络模型,改进其损失函数,并用预先获取的图片对模型进行训练;
(2)基于空间转换网络的人脸对齐:利用变换矩阵对预先获取的图片进行数据采集并生成与模板相同角度大小的对应人脸;
(3)基于YOLOV2对人脸进行检测。
进一步地,步骤(1)所述的卷积神经网络包括卷积层、激活函数层、池化层、BN层、全连接层和softmax损失函数;所述池化层被嵌入到卷积层之间,包括最大池化和平均池化。
进一步地,步骤(1)所述的损失函数的改进如下:
L-sofmax损失函数表达式如下:
Angular softmax损失函数:
Additive margin softmax损失函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011095551.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于RT地址的1553B消息接收方法
- 下一篇:一种2.5D电子封装结构