[发明专利]一种基于稀疏全卷积神经网络的人脸标注方法有效
申请号: | 201710872819.0 | 申请日: | 2017-09-22 |
公开(公告)号: | CN107729819B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 温世平;董明辉 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 卷积 神经网络 标注 方法 | ||
1.一种基于稀疏全卷积神经网络的人脸标注方法,其特征在于,包括:
(1)使用人脸图像数据库对不存在全连接层的全卷积神经网络分割模型进行第一阶段的训练,优化目标函数为交叉熵损失函数加防过拟合项,当全卷积神经网络分割模型的分割精度不再提升时结束第一阶段训练,得到基础全卷积神经网络分割模型;
(2)在优化目标函数中加入group Lasso与intra-group Lasso稀疏正则项,对基础全卷积神经网络分割模型进行第二阶段训练,当基础全卷积神经网络分割模型的分割精度不再提升时结束第二阶段训练,得到用于人脸标注的稀疏全卷积神经网络分割模型;
(3)使用稀疏全卷积神经网络分割模型对待标注的人脸图像进行初步标注,标注过程中裁剪掉稀疏为0的通道,输出结果为待标注的人脸图像中每个像素点标注为头发、皮肤和背景的概率;
(4)使用全连接条件随机场模型结合双元潜能对输出结果进行优化,双元潜能为待标注的人脸图像中不同像素点之间的位置与颜色强度差值,得到最后的标注结果;
所述步骤(2)包括:
在优化目标函数中加入group Lasso与intra-group Lasso稀疏正则项:
其中,ED(W)为损失函数,R(W)为所有权值的正则项,Rg1(W(l))为group Lasso稀疏正则项,Rg2(W(l))为intra-group Lasso稀疏正则项,λ表示过拟合系数,λ1表示group Lasso稀疏正则项的权重,λ2表示intra-group Lasso稀疏正则项的权重,L表示全卷积神经网络分割模型的卷积层总数,W(l)为全卷积神经网络分割模型的第l个卷积层的参数;
经过group Lasso稀疏正则项稀疏优化后,当卷积层中的某一组的参数全部为0时,裁剪该组,达到压缩网络结构的目的;使用intra-group Lasso稀疏正则项稀疏优化后,将卷积层中的不同组相同位置的权值作为一组,进行权值稀疏化,将未裁剪通道继续稀疏优化,当基础全卷积神经网络分割模型的分割精度不再提升时,得到用于人脸标注的稀疏全卷积神经网络分割模型;
所述group Lasso稀疏正则项为:
其中,为全卷积神经网络分割模型的第l个卷积层的参数,Nl,Cl,Hl,Wl分别为该层输入特征图数量,输出特征图数量,输出特征图高度和输出特征图宽度,w(g1)表示每个group Lasso分组内的参数集合,表示每个group Lasso分组内的参数集合中的第i个参数;
所述intra-group Lasso稀疏正则项为:
其中,w(g2)表示每个intra-group Lasso分组内的参数集合,表示每个intra-group Lasso分组内的参数集合中的第i个参数;
所述步骤(1)还包括对全卷积神经网络分割模型进行加权融合,加权融合方式如下:
设P1score,P2score,P3score,P4score,P5score分别为池化层1、池化层2、池化层3、池化层4、池化层5的得分层的特征图,UP2(·)表示2倍的反卷积操作,Mout表示最后融合特征图,则:
Mout=UP2(UP2(UP2(UP2(UP2(P5score)+a1P4score)+a2P3score)+a3P2score)+a4P1score)
其中,a1为池化层4得分层的加权权重,a2为池化层3得分层的加权权重,a3为池化层2得分层的加权权重,a4为池化层1得分层的加权权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710872819.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应急救援系统
- 下一篇:一种应用云计算的智能社区物业管理系统