[发明专利]基于类别级软目标监督的细粒度图像分类模型训练方法在审
申请号: | 202310352190.2 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116563602A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 梅建萍;褚鑫凯 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/74;G06V10/40;G06N3/098 |
代理公司: | 杭州赛科专利代理事务所(普通合伙) 33230 | 代理人: | 余华康 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 类别 目标 监督 细粒度 图像 分类 模型 训练 方法 | ||
1.一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:所述方法以有标签的数据预训练一目标模型;以目标模型的参数初始化EMA模型,根据EMA模型中全连接层的参数计算一相似度矩阵,基于相似度矩阵获得类别级软标签tCla,与图像进行关联;
输入图像,基于目标模型和EMA模型构建模型训练的总损失更新目标模型;以新的目标模型更新EMA模型,并用新EMA模型计算出新的类别级软标签;重复并最小化总损失,实现细粒度图像分类模型的训练。
2.根据权利要求1所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:所述目标函数为,
gc=f(xc;φ)
其中,f表示目标模型,C表示类别总量,c对应每个类别,yc是样本xc的标签,pc是经过归一化处理后模型预测的到第c个类别的概率,T是温度系数,0T5,gc是样本xc经过目标模型f后得到的归一化之前的输出,φ是目标模型的参数。
3.根据权利要求1所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:所述目标模型包括特征提取器和分类器,目标模型的特征提取器和分类器在每一轮基于总损失的梯度反传进行更新;所述EMA模型包括特征提取器和分类器,EMA模型的特征提取器和分类器初始化为目标模型中的特征提取器和分类器,训练过程中EMA模型的特征提取器和分类器基于当前目标模型通过指数滑动平均进行更新。
4.根据权利要求1所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:EMA模型的分类器的全连接层VK×C包括每个类别的权重,K为维度,得到一个相似度矩阵S,
S=VTV,对S的每一列归一化处理,得到类别级软标签tcla。
5.根据权利要求1所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:输入图像,基于目标模型和EMA模型构建模型训练的总损失L包括:
基于目标模型预测的概率分布,计算其与样本真实硬标签之间的交叉熵损失LHard;
基于目标模型预测的概率分布,计算其与类别级软标签之间的KL散度LCla;
基于目标模型预测的概率分布,计算其与EMA模型输出概率分布之间的KL散度LEMA。
6.根据权利要求5所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:L=LHard+λ1LCla+λ2LEMA,其中,λ1和λ2为对应损失的权重系数,λ10,λ20。
7.根据权利要求5所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:KL散度LCla满足,
LCla=KL(tCla,p)
其中,KL散度为KL(t,p),C表示类别总量,c对应每个类别,tCla为类级别的软标签,p是经过归一化处理后模型预测的概率分布。
8.根据权利要求5所述的一种基于类别级软目标监督的细粒度图像分类模型训练方法,其特征在于:KL散度LeMA满足,
LeMA=KL(teMA,p)
其中,KL()为KL散度,tEMA为样本经过EMA模型得到的输出,p是样本经过目标模型得到的概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310352190.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮胎内壁清洗机
- 下一篇:一种多源数据融合语音室内定位方法及相关设备