[发明专利]人脸识别模型的训练方法、装置、计算机设备及存储介质在审
申请号: | 202110277869.0 | 申请日: | 2021-03-15 |
公开(公告)号: | CN112766423A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 陈嘉莉;周超勇;刘玉宇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 贺小旺 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
1.一种人脸识别模型的训练方法,其特征在于,所述方法包括:
在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;
根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;
对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;
根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
2.根据权利要求1所述的人脸识别模型的训练方法,其特征在于,所述根据所述预训练模型从所述无标签样本集中剔除重叠样本得到去重无标签样本集包括:
基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的人脸样本有相同对象的置信度;
根据所述重叠置信度与预设的置信度阈值的比较结果判别所述无标签样本集的样本是否为重叠样本;
剔除所述无标签样本集中的所述重叠样本,得到去重无标签样本集。
3.根据权利要求2所述的人脸识别模型的训练方法,其特征在于:所述基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,包括:
将所述无标签样本集的样本输入所述预训练模型,得到所述预训练模型对应所述样本的预测结果,所述预测结果包括所述带标签样本集中人脸样本的不同标签对应的置信度;
根据所述不同标签对应的置信度,确定所述无标签样本集的样本的重叠置信度。
4.根据权利要求3所述的人脸识别模型的训练方法,其特征在于,所述预训练模型包括逻辑回归分类器,所述逻辑回归分类器用于通过逻辑回归计算所述带标签样本集中人脸样本的不同标签被匹配至所述预训练模型的输入的置信度,将置信度最高的标签确定为预测的标签。
5.根据权利要求1-4中任一项所述的人脸识别模型的训练方法,其特征在于,所述对所述去重无标签样本集的样本分配伪标签得到伪标签样本集,包括:
对去重无标签样本集的样本进行聚类,根据所述聚类的结果,对所述去重无标签样本集的样本分配伪标签。
6.根据权利要求5所述的人脸识别模型的训练方法,其特征在于:
所述对去重无标签样本集的样本进行聚类,包括:对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本;
所述根据聚类结果,对所述去重无标签样本集的样本分配伪标签得到伪标签样本集,包括:确定不同样本组各自不同的伪标签,得到伪标签样本集;所述样本组的伪标签与所述带标签样本集中样本的所有标签都不同。
7.根据权利要求6所述的人脸识别模型的训练方法,其特征在于,
所述对去重无标签样本集的样本进行聚类得到与所述若干样本组,包括:
根据所述预训练模型对所述去重无标签样本集的所有样本分别提取样本特征;
根据所述去重无标签样本集中所有样本的样本特征,通过图卷积网络在所述合并样本集的所有样本上构建最近邻图;
根据边缘权重阈值和所述最近邻图的边缘权重,确定所述最近邻图的若干连通分支,所述边缘权重阈值根据威布尔分布设置;
根据所述连通分支将所述去重无标签样本集的样本分成若干组,得到所述若干样本组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110277869.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:刷新控制电路及存储器
- 下一篇:一种带有全自动排渣系统的榨汁机