[发明专利]一种基于单个卷积神经网络的面部多特征点定位方法有效
申请号: | 201710967121.7 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107808129B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 练智超;朱虹;李德强 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 单个 卷积 神经网络 面部 特征 定位 方法 | ||
1.一种基于单个卷积神经网络的面部多特征点定位方法,其特征在于,包括以下步骤:
步骤1、扩充训练样本;
步骤2、根据数据集提供的与每个样本对应的面部特征点坐标,确定人脸边框;
步骤3、采用缩放、旋转、平移和翻转四种操作来扩充数据,弥补训练图像特征点标注的不足;
步骤4、根据人脸边界框提取出人脸图像,并进行归一化处理;
步骤5、设计网络结构;
步骤6、训练网络,设置网络的学习率和每次处理数据的数量,完成面部多特征点的定位;
步骤2所述的根据数据集提供的与每个样本对应的面部特征点坐标,确定人脸边框,具体处理方式的伪代码如下:
输入:一张测试图片IMG;与该测试图像对应的面部特征点坐标(xi,yi)={(x1,y1),(x2,y2)···(xm,ym)},i∈{1,...,m},其中m为特征点的个数;
输出:该测试图片中的人脸边界框的坐标{(X1,Y1),(X2,Y2)}
1)X1←min(xi)
2)Y1←min(yi)
3)X2←max(xi)
4)Y2←max(yi)
5)End;
步骤5所述的设计网络结构,具体如下:
网络输入的是224×224×3的彩色脸部图像和相应的面部特征点坐标n,其中n是面部特征点总数的两倍;
网络层数分为八组:
第一组由第一卷积层(Conv1_1)和第一最大池化层(Pool1)组成;
第二组由第二卷积层(Conv2_1)和第二最大池化层(Pool2)组成;
第三组由堆叠的第三、四卷积层(Conv3_1、Conv3_2)和第三最大池化层(Pool3)组成;
第四组由堆叠的第五、六卷积层(Conv4_1、Conv4_2)和第四最大池化层(Pool4)组成;
第五组由堆叠的第七、八卷积层(Conv5_1、Conv5_2)和第五最大池化层(Pool5)组成;
第六组为第一个完全连接层(Fc6),连接第五组中第五最大池化层(Pool5)的神经元,输出数量为4096;
第七组为第二个完全连接层(Fc7),连接第一个完全连接层(Fc6)的神经元,输出数量为4096;
第八组为第三个完全连接层(Fc8),连接输出数为n,n是面部特征点总数的两倍;
在卷积层中,卷积核的大小为3×3,设置步长为1,使得像素逐个滑动,边缘扩充设置为1,即宽度和高度都扩充了2个像素,卷积运算表示为:
yj=∑ikij*xi+bj (1)
其中xi和yj分别是第i个输入图和第j个输出图,kij表示第i个输入图和第j个输出图之间的卷积核,bj是第j个输出图的偏差,*表示卷积;
在池化层中,采用最大池化的方式,即对邻域内特征点取最大,最大池化表示为:
其中,第i个输入映射xi中的每个h×h局部区域,被合并为第i个输出映射中的神经元;表示i个输出映射图中坐标为(j,k)的像素值,m,n分别表示局部区域内的x轴坐标与y轴坐标,设置池化核的大小为3×3,步长为2;
在每个卷积层之后添加非线性单元ReLU作为激活函数,在第一、二个完全连接层(Fc6、Fc7)增加Dropout操作,表达式如下:
r=m·*a(Wv) (3)
其中,v是n*1维列向量,W是d*n维的矩阵,m是个d*1的列向量,a(x)是一个满足a(0)=0的激发函数形式,m和a(Wv)相乘是对应元素的相乘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710967121.7/1.html,转载请声明来源钻瓜专利网。