[发明专利]一种基于噪声剔除的自步学习人脸年龄估计方法有效
| 申请号: | 201911308841.8 | 申请日: | 2019-12-18 |
| 公开(公告)号: | CN111160161B | 公开(公告)日: | 2022-03-15 |
| 发明(设计)人: | 潘力立;艾仕杰 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08 |
| 代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 噪声 剔除 学习 年龄 估计 方法 | ||
1.一种基于噪声剔除的自步学习人脸年龄估计方法,该方法包括:
步骤1:对数据集进行预处理;
获取人脸数据集,并标定对应的实际年龄;再对所有的人脸图像利用MTCNN进行人脸检测、对齐,并根据人脸大小及位置将输入图像归一化为224*224*3大小的RGB图像;最后得到经过预处理后的带有年龄标签的人脸数据集图像;
步骤2:构建深度回归森林;
和分别表示深度回归森林的输入和输出空间,η表示卷积神经网络结构的参数信息,f(x;η)表示输入x经过该卷积神经网络后得到的特征值,表示决策树,该决策树由叶节点和分离节点组成,σ是Sigmoid函数,是索引函数,使函数f(x;η)的第个输出与分离节点n对应,这个对应关系是随机获取的,gn(x;η)确定了样本x送入到该分离节点的左子树的概率,pl(y)为叶节点在输出空间的高斯分布,其中μl和Σl分别表示均值矩阵和协方差矩阵;表示以分离节点n为根节点的树,nl和nr分别表示分离节点n的左右孩子,和分别表示以nl和nr为根节点的左右子树,和分别表示左右子树和的叶节点的集合;
1)分离节点函数gn(x;η):采用VGG-16结构作为深度回归森林的前端部分来提取特征;将卷积神经网络最后的全连接层输出的特征值通过一个sigmoid函数归一化到0~1之间,然后随机分配到各个树的分离节点上作为分裂概率gn(x;η),对于每一个分离节点都有一个分离节点函数:
2)输入x被送到某一个叶节点l的概率w(l|x;η):每张人脸图像在每棵树的分离节点处以分裂概率被划分到左右子树,最终落入叶节点中;再将人脸图像所经过路径上的各个概率相乘,得到了一个输入x被送到某一个叶节点l的概率为:
其中表示指示函数,当为真时,当为假时,
3)叶节点的高斯分布pl(y):落入到各个叶节点中的人脸图像对应的年龄数据符合不同的高斯分布pl(y),表示不同的年龄分布结构,N代表数据集中总的图像数量,对于每一个叶节点在输出空间都拥有一个高斯分布的概率密度函数:
4)在决策树下的条件概率函数叶节点中的高斯分布与输入x被送到某一个叶节点l的概率w(l|x;η)构成一个混合高斯模型的结构:
5)和表示为输入x基于该深度回归网络的估计年龄:决策树的输出由各个高斯分布与概率w(l|x;η)加权得到,再对多棵决策树产生的结果进行平均得到最后的年龄估计所以x和y之间的映射函数表示为:
6)训练过程:给定一个经过预处理后的人脸数据集图像xi表示第i张图像,yi表示其对应的年龄标签,则深度回归森林的损失函数为:
①固定叶节点的参数p(即固定参数μl和Σl),此时损失函数对CNN的参数η的偏导数为:
其中第一项为:
根据上面推导可知,通过梯度下降法学习参数η;
②固定CNN的参数η,去优化叶节点的参数p,令
然后通过变分边界法来解决这个优化问题;
在变分边界法中,原始目标函数被一系列迭代最小化的边界代替;为了得到的上界,运用Jensen不等式得:
其中:
表示一定值,对于ζl(p;xi,yi)有以下性质,能够满足Jensen不等式的条件:
ζl(p;xi,yi)∈[0,1]
定义:
所以就成了的上界,对于任何的p和有如下性质:
这两条性质构成了满足变分边界法的条件;pl(y)是由均值矩阵μl和协方差矩阵Σl这两部分参数构成,令μ和Σ表示由所有叶节点控制这两个参数;固定Σ时,定义:
则有:
这说明也是的一个上界,令μ(t)为μ第t次迭代的值,所以ψ(μ,μ(t))是的一个上界;在下一次迭代中,选择使不等式成立的μ值μ(t+1),这说明了在确保后,通过最小化去代替最小化则得:
ψ(μ,μ(t))关于μl的偏导数为:
令其中0表示零矢量或矩阵,可得:
同理,固定μ时,定义:
令则得:
ξ(Σ,Σ(t))关于Σl的偏导数为:
令得:
在得到μl和Σl的更新规则后,在上进行k-均值聚类,以获得叶节点子集,Ii表示分配给yi的聚类值,根据聚类结果得到初始值和即:
通过变分边界法学习参数p;
两个学习步骤①和②交替执行,共同优化特征学习和年龄估计的模型,当达到规定迭代次数时停止迭代;
7)最后,数据集的平均绝对误差为:
其中是第i张人脸图片的预测年龄,yi是第i张人脸图片的实际年龄;
步骤3:将所有的经过步骤1后的训练图片根据步骤2训练;
假设共有N张训练图像,全都经过步骤1处理,随后将这N张训练图像输入步骤2中训练,将得到每张图像的绝对误差按从小到大进行排序;
步骤4:基于噪声剔除的自步学习框架下的目标损失函数;
根据步骤3得到的绝对误差AE由小到大的顺序对训练集重新排列,表示重新排序后的训练集,xi′表示第i张图像,yi′表示其对应的年龄标签,令表示深度回归森林的损失函数,其中表示对第i张的图像xi′的估计年龄,
则对第i张图像的损失函数Li()表示为:
则深度回归森林的损失函数L()表示为:
cap()表示基于剔除噪声样本的函数,∈为设定阈值:
则对第i张图像基于剔除噪声样本的深度回归森林的损失函数Lic()表示为:
由于噪声图像的损失函数也较大,则通过上式可以剔除损失函数大于设定阈值∈的一部分噪声图像,因此避免了噪声样本的干扰;
m()是二元自步正则项,参数λ控制每次加入网络训练的数量,m()表示为:
隐变量v只有0和1两个取值,0代表着该图像不被送入深度回归网络训练,1代表该图像被送入深度回归网络训练,则基于噪声剔除的自步学习框架下的目标损失函数为:
即是:
其中,对于Li∈,有:可得:
而对于Li≥∈,有:可得:
vu=0
步骤5:根据步骤4得到的目标损失函数建立基于噪声剔除的自步学习人脸年龄估计模型;
步骤6:根据步骤3得到的重新排序后的数据集图像对步骤5得到的人脸年龄估计模型进行训练;
1)取训练集中的前10%N数量的图像进行训练,得到一个caffemodel_1模型,再将剩余90%N的图像经过步骤3在caffemodel_1模型的基础上重新排序;
2)然后再取前10%N数量的图像与已取出的10%N数量的图像混合,一起在caffemodel_1模型的基础上进行训练,得到一个caffemodel_2模型,再将剩余80%N的图像经过步骤3在caffemodel_2的基础上重新排序;
3)然后再取前10%N数量的图像与已取出的20%N数量的图像混合,一起在caffemodel_2模型的基础上进行训练,得到一个caffemodel_3模型,再将剩余70%N的图像经过步骤3在caffemodel_3的基础上重新排序;
4)以此类推,直到80%N数量的图像送入训练,此时得到caffemodel_8模型,同时丢弃了训练集中质量最差的20%N数量的噪声图像;
步骤7:根据最后训练好的caffemodol_8模型对实际人脸图像的年龄进行预测,完成人脸图像的年龄预测过程,同时去除了噪声图像的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911308841.8/1.html,转载请声明来源钻瓜专利网。





