[发明专利]一种通道自关联的知识蒸馏方法与系统有效
申请号: | 202110673166.X | 申请日: | 2021-06-17 |
公开(公告)号: | CN113255899B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 唐乾坤;徐晓刚;王军;徐冠雷;何鹏飞;曹卫强 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通道 关联 知识 蒸馏 方法 系统 | ||
1.一种通道自关联的知识蒸馏方法,其特征在于包括以下步骤:
步骤S1:向教师模型和学生模型中输入相同的图片数据,得到学生模型和教师模型的图片特征,选定学生模型和教师模型中需要进行知识蒸馏的卷积特征层,选定的学生模型的中间特征层为:,选定的教师模型的中间特征层为:,其中,
步骤S2:将选定的学生模型和教师模型卷积特征层的通道进行通道自关联,通道自关联的方式如下:
设定一个二维整数矩阵,其中,,所述二维整数矩阵中值为正整数,且仅为0或者1,所述二维整数矩阵的行表示选定的学生模型特征层的通道数,列表示选定的教师模型特征层的通道数,矩阵值为0时,表示学生模型特征层的行对应的通道,不从教师模型特征层的列对应的通道学习知识,矩阵值为1时,表示学生模型特征层的行对应的通道,从教师模型特征层的列对应的通道学习知识;学生模型的每个通道可以与教师模型的多个通道关联,而教师模型的每个通道可以传输知识到学生模型的多个通道;
步骤S3:自关联后的教师模型通道通过加权方式传输知识至学生模型通道;
步骤S4:根据关联的通道蒸馏知识,并进行训练,在训练时同时优化自关联的二维整数矩阵和学生模型:
其中,表示损失函数,
步骤S5:部署训练好的学生模型,输入图片数据进行推理测试。
2.根据权利要求1所述的一种通道自关联的知识蒸馏方法,其特征在于所述步骤S1中,分别从教师模型和学生模型的中间卷积层中选择一个以上特征层。
3.根据权利要求1所述的一种通道自关联的知识蒸馏方法,其特征在于所述步骤S3中,学生模型每个通道在融合教师模型通道特征时,采用加权方式,权重包括但不限于通过计算每个关联的教师模型和学生模型通道的语义相关性得到,其形式化为:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110673166.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动力电池降压电路与供电系统
- 下一篇:一种商品猪的杂交培育方法