[发明专利]年龄估计模型的训练方法、年龄估计方法以及对应的装置有效
| 申请号: | 201910595412.7 | 申请日: | 2019-07-03 |
| 公开(公告)号: | CN110287942B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 章超;刘帅成 | 申请(专利权)人: | 成都旷视金智科技有限公司;北京旷视科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
| 地址: | 611730 四川省成都市郫县*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 年龄 估计 模型 训练 方法 以及 对应 装置 | ||
本申请实施例提供了一种年龄估计模型的训练方法、年龄估计方法以及对应的装置,该训练方法包括:获取训练样本,各样本为标注有对应的年龄标签的人脸图像;确定各样本的年龄标签所对应的年龄标签分布;基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛;其中,总损失函数包括分布损失函数和回归损失函数,分布损失函数表征了样本的年龄标签分布和预测年龄分布的差异,回归损失函数表征了样本的年龄标签和预测年龄值的差异。基于本申请实施例所提供的方案,能够有效提供年龄预测的准确性,更好的满足了实际应用需求。
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种年龄估计模型的训练方法、年龄估计方法以及对应的装置。
背景技术
人脸的年龄进程是比较难可控的、非常个性化的,深度学习之前的传统的方法经常会存在泛化能力不足的问题。最近几年,在年龄估计中,深度CNN(Convolutional NeuralNetwork,卷积神经网络)因其具有较强的泛化能力而成为主要的研究方法。虽然当前对于年龄估计的研究已经有了很大程度的改进,但是由于人脸年龄是一个“动态”变化的个性化过程,现有的年龄估计方案仍有待改进。
发明内容
本申请实施例提供了一种年龄估计模型的训练方法、年龄估计方法以及对应的装置,具体技术方案如下:
第一方面,本申请实施例提供了一种年龄估计模型的训练方法,年龄估计模型包括依次级联的特征提取模块、概率分布预测模块和年龄值预测模块,其中,特征提取模块,用于提取输入至模型的人脸图像的图像特征,概率分布预测模块,用于根据图像特征输出人脸图像中的人脸年龄对应于各个预划分的年龄端点值的预测年龄分布;年龄值预测模块,用于根据预测年龄分布输出人脸年龄的预测年龄值;该训练方法包括:
获取训练样本,各样本为标注有对应的年龄标签的人脸图像;
确定各样本的年龄标签所对应的年龄标签分布;
基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛;
其中,总损失函数包括分布损失函数和回归损失函数,分布损失函数表征了样本的年龄标签分布和预测年龄分布的差异,回归损失函数表征了样本的年龄标签和预测年龄值的差异。
可选的,确定各样本的年龄标签所对应的年龄标签分布,包括:
根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布;
其中,年龄标签分布中的非零元素值为年龄标签属于相邻的至少两个年龄端点值中各端点值的概率。
可选的,年龄标签为相邻的至少两个年龄端点值的凸组合,年龄标签属于相邻的至少两个年龄端点值中各端点值的概率为凸组合中相邻的至少两个年龄端点值中各端点值所对应的权重值。
可选的,预划分的年龄端点值包括基于至少两种切分粒度分别对年龄范围进行划分得到的端点值;
根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布,包括:
分别根据每种切分粒度所对应的端点值中与年龄标签相邻的至少两个年龄端点值,确定每种切分粒度所对应的年龄标签分布;
基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛,包括:
基于样本和每种切分粒度所对应的年龄标签分布,分别对年龄估计模型进行训练,直至每种切分粒度所对应的总损失函数均收敛。
可选的,若年龄标签为预划分的年龄端点值中的一个,确定各样本中的年龄标签所对应的年龄标签分布,包括以下任一种:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都旷视金智科技有限公司;北京旷视科技有限公司,未经成都旷视金智科技有限公司;北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910595412.7/2.html,转载请声明来源钻瓜专利网。





