[发明专利]一种用于图像检索的双重知识蒸馏方法有效
申请号: | 202110657910.7 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113255822B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 张雪毅;陈伟;王维平;白亮;刘忠;刘丽 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06F16/55;G06F16/53 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 图像 检索 双重 知识 蒸馏 方法 | ||
1.一种用于图像检索的双重知识蒸馏方法,其特征在于,包括由两个专业教师模型和一个学生模型组成的双重知识蒸馏框架,其中,两个专业教师模型分别是固定教师模型和动态教师模型,在训练任务t之前,固定教师模型在前任务的基础上接受训练,然后固定其参数,并对全连接层嵌入的D维特征进行知识蒸馏;在学生模型学习任务t时,先将具有随机类标签的高斯噪声Z输入给固定教师模型,并使用损失基于固定教师模型对Z进行优化,生成前任务的代表性图像,为聚类损失,表示Z中存储的统计数据与当前统计数据之间的差异,然后使用图像和类标签来构建一个混合数据集,将混合数据输入到固定教师模型,以便将更丰富的先验知识传递给学生模型来减少对前一任务的遗忘,学生模型的参数从固定教师模型上复制,其训练方案与固定教师模型一致;动态教师模型与学生模型共同接受训练,向学生模型传递新信息,进行辅助知识蒸馏来提高学生模型对新任务的泛化能力,其训练图像从原始数据集中挖掘。
2.如权利要求1所述的用于图像检索的双重知识蒸馏方法,其特征在于,使用三元组损失函数作为基本约束来训练模型。
3.如权利要求2所述的用于图像检索的双重知识蒸馏方法,其特征在于,使用固定教师模型对全连接层中嵌入的D维特征进行知识蒸馏,其特征表示为,其中N为mini batch的大小,学生模型的特征表示为,固定教师模型的知识蒸馏损失为,
其中,为权重因子,归一化函数为Softmax函数,KL散度用来描述和的差异,;,K(•)为内积,中的每一项表示同一激活(i=j)或不同激活(i≠ j)之间的相关性。
4.如权利要求3所述的用于图像检索的双重知识蒸馏方法,其特征在于,所述使用图像和类标签来构建一个混合数据集,具体为:,属于原始训练集,混合标签为。
5.如权利要求4所述的用于图像检索的双重知识蒸馏方法,其特征在于,固定教师模型的每个卷积层后面都有一个BatchNorm层,每个BatchNorm层包括通道运行均值和运行方差,使用教师模型每一个卷积层的输出来计算批处理均值和批方差,为权重因子,。
6.如权利要求5所述的用于图像检索的双重知识蒸馏方法,其特征在于,聚类损失为K-means聚类损失,其函数为
其中为权重因子,N个噪声张量的mini-batch包含K个类,每一类为P个张量,,类间距离,类内距离中的元素数等于p。
7.如权利要求6所述的用于图像检索的双重知识蒸馏方法,其特征在于,学生模型的三元组损失函数为,其中,为权重因子,在每个训练阶段,根据混合标签,正样本图像和负样本图像分别为,均来自于混合数据集。
8.如权利要求7所述的用于图像检索的双重知识蒸馏方法,其特征在于,动态教师模型为,参数为,为权重因子,其三元组损失函数为
训练图像只从数据集的中挖掘,为每个类c包含不同数量的图像共享相同的标签。
9.如权利要求8所述的用于图像检索的双重知识蒸馏方法,其特征在于,动态教师模型辅助进行知识蒸馏的损失函数为
其中,为权重因子,,,,,。
10.如权利要求9所述的用于图像检索的双重知识蒸馏方法,其特征在于,双重知识蒸馏框架的目标函数为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110657910.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序