[发明专利]用于人脸关键点定位与语义分割的多任务检测装置有效
申请号: | 201711310450.0 | 申请日: | 2017-12-11 |
公开(公告)号: | CN108304765B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 赵昱程;唐帆;董未名;张晓鹏 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 关键 定位 语义 分割 任务 检测 装置 | ||
1.一种用于人脸关键点定位与语义分割的多任务检测装置,其特征在于,所述装置包括多任务深度模型,其配置为采用深度学习算法对目标人脸图像进行语义分割,并获取所述目标人脸图像中的人脸关键点;
所述多任务深度模型包括关键点定位模块和语义分割模块;
所述关键点定位模块,配置为基于编码网络提取所述目标人脸图像中的人脸特征,并依据所提取的人脸特征获取人脸关键点的位置信息;
所述语义分割模块,配置为基于解码网络对特征图进行语义分割;其中,所述特征图为所述关键点定位模块输出的包含人脸关键点的位置信息的图像;所述解码网络中每个解码单元分别与编码网络中对应的编码单元连接;
所述编码单元包括相连的卷积层和下采样层,其中,所述卷积层的输入端与所述下采样层的输出端分别为该编码单元的输入端与输出端;
所述解码单元包括依次连接的上采样层、信息增强单元与卷积层,并且所述信息增强单元还与对应编码单元中卷积层的输出端连接,其中,所述上采样层的输入端与所述卷积层的输出端分别为该解码单元的输入端与输出端;
所述信息增强单元包括第一增强子单元;
所述第一增强子单元包括两个卷积层和一个残差相加子单元,其中,所述第一增强子单元的一个输入端直接与所述残差相加子单元的一个输入端连接,所述第一增强子单元的另一个输入端通过一个所述卷积层与所述残差相加子单元的另一个输入端连接,所述第一增强子单元的输出端通过另一个所述卷积层与所述残差相加子单元的输出端连接;
所述信息增强单元包括第二增强子单元;
所述第二增强子单元包括两个卷积层和一个叠加子单元,其中,所述第二增强子单元的一个输入端通过一个所述卷积层与所述叠加子单元的一个输入端连接,所述第二增强子单元的另一个输入端直接与所述叠加子单元的另一个输入端连接,所述第二增强子单元的输出端通过另一个所述卷积层与所述叠加子单元的输出端连接。
2.根据权利要求1所述的多任务检测装置,其特征在于,所述装置还包括第一模型训练模块,其配置为基于预设第一训练样本图像,并按照下式所示的损失函数lossL对所述关键点定位模块进行网络训练,其中,所述预设第一训练样本图像包含人脸关键点与五官语义分割标注信息;
其中,所述N和i分别为预设第一训练样本图像中人脸关键点的总数和序号,所述为采用所述关键点定位模块对所述预设第一训练样本图像检测得到的第i个人脸关键点的位置信息,所述(ai,bi)为对所述预设第一训练样本图像中第i个人脸关键点进行归一化处理后的位置信息,
并且所述(xi,yi)为所述第i个人脸关键点对应的像素位置信息,ω和h分别为所述预设第一训练样本图像的宽和高,(x,y)为所述预设第一训练样本图像的中点位置信息。
3.根据权利要求1所述的多任务检测装置,其特征在于,所述装置还包括第二模型训练模块,其配置为按照下式所示的损失函数lossS对所述语义分割模块进行网络训练:
其中,所述为特征图中第j个像素点对应的五官语义分割标注信息;所述所述中的“zj,c”为语义分割模块中输出层的第c个通道所输出的第j个像素点的像素值,所述为语义分割模块中输出层所输出的第j个像素点的像素累加值,所述中的zj为语义分割模块中输出层所输出的第j个像素点的最大像素值,所述n为语义分割模块中输出层所输出的特征图分辨率。
4.根据权利要求1所述的多任务检测装置,其特征在于,
所述解码网络中首个所述解码单元的信息增强单元为所述第一增强子单元,其他所述解码单元的信息增强单元为所述第二增强子单元。
5.根据权利要求1-3任一项所述的多任务检测装置,其特征在于,所述装置还包括第三模型训练模块,其配置为基于预设第二训练样本图像,并按照下式所示的损失函数LossD对所述关键点定位模块进行初始化网络训练:
LossD=-(1-l)*log(1-p)-l*log(p)
其中,所述p为关键点定位模块预测所述预设第二训练样本图像为正样本的概率,所述l为所述预设第二训练样本图像的训练标注,当输入至关键点定位模块的预设第二训练样本图像为正样本时l=1,当输入至关键点定位模块的预设第二训练样本图像为负样本时l=0,所述正样本与负样本分别为包含与未包含人脸的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711310450.0/1.html,转载请声明来源钻瓜专利网。