[发明专利]一种基于通道自监督的在线知识蒸馏方法在审

专利信息
申请号: 202210674288.5 申请日: 2022-06-14
公开(公告)号: CN114913343A 公开(公告)日: 2022-08-16
发明(设计)人: 刘明;王晓敏;范世晓;龚海刚;程旋;解天舒;邓佳丽 申请(专利权)人: 电子科技大学长三角研究院(衢州)
主分类号: G06V10/44 分类号: G06V10/44;G06N3/04;G06N3/08;G06V10/764;G06V10/774;G06V10/82
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 杨春
地址: 324000 浙江省衢*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 通道 监督 在线 知识 蒸馏 方法
【说明书】:

发明涉及一种基于通道自监督的在线知识蒸馏方法,包括:粗粒度特征提取步骤:将数据进行归一化处理后的输出结果output分别输入到两个网络模型中进行特征提取;自监督学习步骤:将经过粗粒度特征提取步骤后的特征图输入到样本多样性模块中进行特征转换操作,对数据输出不同的联合标签;在线动态蒸馏步骤:通过对两个网络模型分别设置一个动态系数对具有同样特征转换的分支之间进行相互学习,不断优化两个网络多样性模块的权重,并在损失函数值最小时输出输入样本的标签。本发明随着样本、网络和分支多样性的增强,样本数据量变大,人工标注标签任务繁琐,在知识蒸馏中加入自监督学习,使其不需要人工干预,可以降低成本和资源。

技术领域

本发明涉及计算机视觉技术领域,尤其涉及一种基于通道自监督的在线知识蒸馏方法。

背景技术

卷积神经网络作为计算机视觉的重要方法,对图像分类任务能够获得较高的精度。但是随着图像中包含的可提取特征信息越来越多,许多图像中包含的干扰噪声也越来越多,在此基础上增加模型的复杂度会成倍的消耗设备资源,而过于复杂的模型在许多设备上都难以部署,因此迫切需要通过迁移学习的手段提升小模型的网络性能。知识蒸馏作为一种重要的迁移学习的方法,在复杂的卷积神经网络模型中应用广泛。知识蒸馏通过引入一个复杂的高性能教师网络,将经过蒸馏后的软标签加入到损失函数中,来指导一个易部署的简单学生进行训练,从而实现知识迁移。

传统的知识蒸馏大多是离线工作的,其主要思想是从一个受过预训练的教师模型转移到一个学生模型。教师模型是预先设定好的,离线蒸馏方法主要侧重于改进知识转移的不同部分,包括知识的设计和用于特征匹配或分布匹配的损失函数以及样本之间对应相似的特征向量。离线蒸馏之间的知识传递是单向的,只能从教师模型传递到学生模型上。预先训练好教师网络的方式也让传统的离线蒸馏变成一个了两阶段的训练方法。在教师模型的指导下,学生模型的训练往往较为高效,但是教师与学生之间的能力差距一直存在,学生往往很大程度上依赖于教师。如果在离线知识蒸馏中缺少强大的教师模型,会使得学生模型的蒸馏性能下降,出现同质性问题。

发明内容

本发明的目的在于克服现有技术的缺点,提供了一种基于通道自监督的在线知识蒸馏方法,解决了现有知识蒸馏方法存在的容易出现网络同质化的问题。

本发明的目的通过以下技术方案来实现:一种基于通道自监督的在线知识蒸馏方法,所述在线知识蒸馏方法包括:

粗粒度特征提取步骤:将数据进行归一化处理后的输出结果output分别输入到两个网络模型中进行特征提取;

自监督学习步骤:将经过粗粒度特征提取步骤后的特征图输入到样本多样性模块中进行特征转换操作,对数据输出不同的联合标签;

在线动态蒸馏步骤:通过对两个网络模型分别设置一个动态系数对具有同样特征转换的分支之间进行相互学习,不断优化两个网络多样性模块的权重,并在损失函数值最小时输出输入样本的标签。

所述粗粒度特征提取步骤具体包括:将归一化后的样本送入到网络模型的卷积层对输入的数据进行下采样,使其能最大程度的保留原始图像信息,随后将输出通过BN层和激活函数后的值送入到网络模型前两层进行卷积操作,通过卷积层中不同的卷积核对图像中不同的特征进行提取,每个卷积核在原图上滑动进行卷积计算生成一张特征图,针对不同的特征的卷积核进行卷积操作后生成一系列的特征图,完成对输入样本进行粗粒度特征提取,池化层通过一个固定的函数进行运算,不需要保留参数。

所述自监督学习步骤具体包括:将经过池化后的特征图送入到样本多样性模块中进行特征转换操作,对于不同特征转换的特征图送入到网络不同的分支中,在目标多样性模块中生成与不同特征增强方式对于的标签,在分支中进行自监督学习使网络模型识别需要丢弃方位的特征信息,提高网络模型的识别能力,最后通过分类器对数据输出不同的联合标签,表示图像原本的分类和进行的特征增强方式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210674288.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top