[发明专利]模型训练方法、装置、存储介质及电子设备在审
申请号: | 202110656444.0 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113283598A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 龙明盛;江俊广;刘裕峰;蔡东阳;郭小燕;郑文;王建民 | 申请(专利权)人: | 清华大学;北京达佳互联信息技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 存储 介质 电子设备 | ||
本公开关于一种模型训练方法、装置、存储介质及电子设备,上述模型训练方法应用于关键点检测模型,上述关键点检测模型包括:特征提取器,回归器和对抗回归器,上述模型训练方法包括:确定上述关键点检测模型中待更新的目标对象,其中,上述目标对象包括:上述特征提取器,上述回归器和上述对抗回归器;对上述目标对象的网络参数进行更新,以使上述关键点检测模型从源域向目标域迁移,以至少解决相关技术中的域自适应方法无法实现关键点检测模型在不同的数据域之间进行迁移的问题。
技术领域
本公开涉及模型训练技术领域,尤其涉及一种模型训练方法、装置、存储介质及电子设备。
背景技术
相关技术中,针对深度学习模型的分类标注,在真实场景中存在关键点标注的难度大、成本高,而虚拟场景下存在关键点标注难度小、成本低的问题,因此,目前的前景方向是将虚拟数据训练出的模型迁移到真实数据上。
但是,由于虚拟数据和真实数据之间存在着巨大的领域差距(domain gap),而且当前的域自适应方法(domain adaptation)主要适用于分类问题,难以在关键点检测类的回归问题上带来帮助,无法实现关键点检测模型在不同的数据域之间进行迁移。
发明内容
本公开提供一种模型训练方法、装置、存储介质及电子设备,以至少解决相关技术中的域自适应方法无法实现关键点检测模型在不同的数据域之间进行迁移的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种模型训练方法,上述模型训练方法应用于关键点检测模型,上述关键点检测模型包括:特征提取器,回归器和对抗回归器,上述模型训练方法包括:确定上述关键点检测模型中待更新的目标对象,其中,上述目标对象包括:上述特征提取器,上述回归器和上述对抗回归器;对上述目标对象的网络参数进行更新,以使上述关键点检测模型从源域向目标域迁移。
可选的,上述对上述目标对象的网络参数进行更新的步骤包括:对上述特征提取器,上述回归器和上述对抗回归器中的第一网络参数进行更新。
可选的,上述对上述特征提取器,上述回归器和上述对抗回归器中的第一网络参数进行更新的步骤包括:对上述回归器和上述对抗回归器输出的热力图进行归一化处理,得到第一处理结果;计算上述源域上每个关键点标签对应的热力图与上述源域上全部关键点标签对应的热力图总和的比值,得到第二处理结果;在空间维度上对上述第一处理结果与上述第二处理结果进行散度计算,得到第三处理结果;基于上述第三处理结果更新上述特征提取器,上述回归器和上述对抗回归器中的第一网络参数,以重新获取上述第三处理结果,直至当上述第三处理结果满足第一预设条件时,停止更新上述第一网络参数。
可选的,上述对上述目标对象的网络参数进行更新的步骤包括:对上述对抗回归器中的第二网络参数进行更新,以使得最大化上述对抗回归器在上述目标域的散度和上述回归器预测的散度的差异。
可选的,上述对上述对抗回归器中的第二网络参数进行更新的步骤包括:获取上述回归器在上述目标域上输出的与多个关键点对应的多个热力图,并计算上述多个关键点中除目标关键点之外其余关键点对应的剩余热力图总和;计算上述目标关键点对应的第一热力图与上述剩余热力图总和的比值,得到第四处理结果;获取上述对抗回归器在上述目标域上输出的与上述第一热力图对应的第二热力图,并对上述第二热力图进行归一化处理,得到第五处理结果;在空间维度上对上述第四处理结果与上述第五处理结果进行散度计算,得到第六处理结果;基于上述第六处理结果更新上述对抗回归器中的第二网络参数,以重新获取上述第六处理结果,直至当上述第六处理结果满足第二预设条件时,停止更新上述第二网络参数。
可选的,上述对上述目标对象的网络参数进行更新的步骤包括:对上述特征提取器中的第三网络参数进行更新,以使得最小化上述对抗回归器在上述目标域的散度和上述回归器预测的散度的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110656444.0/2.html,转载请声明来源钻瓜专利网。