[发明专利]基于自蒸馏的图像分类方法、系统、存储介质和电子设备有效

专利信息
申请号: 202310071832.1 申请日: 2023-01-13
公开(公告)号: CN116416456B 公开(公告)日: 2023-10-24
发明(设计)人: 程彦皓 申请(专利权)人: 北京数美时代科技有限公司;数美天下(北京)科技有限公司
主分类号: G06V10/764 分类号: G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/096
代理公司: 北京轻创知识产权代理有限公司 11212 代理人: 厉洋洋
地址: 100012 北京市朝阳区来广营西路*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 蒸馏 图像 分类 方法 系统 存储 介质 电子设备
【说明书】:

发明公开了一种基于自蒸馏的图像分类方法、系统、存储介质和电子设备,包括:基于多个图像样本,对卷积神经网络进行迭代训练,得到第一图像分类模型;将每个图像样本输入第一图像分类模型,得到并将输出特征图分别输入特征处理模块和注意力机制模块,得到并根据原始特征图和注意力特征图进行自蒸馏,得到并根据每个图像样本的自蒸馏损失值,对第一图像分类模型的参数进行优化,直至第二图像分类模型满足预设条件时,将第二图像分类模型确定为目标图像分类模型;将待测图像输入至目标图像分类模型,得到图像分类结果。本发明能够利用模型自身的注意力图进行蒸馏,在有效压缩图像分类模型训练时间的同时,确保了图像分类的效果不受影响。

背景技术

知识蒸馏是将知识从预先训练的较大的教师网络转移到学生网络的方法,使得较小的学生网络获得与教师网络相近的识别效果,同时降低部署时的计算复杂度。但现有的知识蒸馏方法,首先要训练较大的教师网络,待教师网络训练完成后,利用教师网络训练学生网络,这种方法虽然还可以有效提升学生网络的效果,但训练周期较长,难以维护。

因此,如何在不损失学生网络的效果的基础上,有效节省训练时间,是当前亟需解决的技术问题。

发明内容

为解决上述技术问题,本发明提供了一种基于自蒸馏的图像分类方法、系统、存储介质和电子设备。

本发明的基于自蒸馏的图像分类方法的技术方案如下:

基于多个图像样本,对用于图像分类的卷积神经网络进行迭代训练,得到第一图像分类模型;

将任一图像样本输入所述第一图像分类模型,得到该图像样本对应的输出特征图,并将所述输出特征图输入至特征处理模块,得到该图像样本的原始特征图,将所述输出特征图输入至注意力机制模块,得到该图像样本的注意力特征图,并基于该图像样本的原始特征图和注意力特征图进行自蒸馏,得到该图像样本的自蒸馏损失值,直至得到每个图像样本的自蒸馏损失值;

基于所有的自蒸馏损失值,对所述第一图像分类模型的参数进行优化,得到第二图像分类模型,将所述第二图像分类模型作为所述第一图像分类模型并返回执行所述将任一图像样本输入所述第一图像分类模型的步骤,直至所述第二图像分类模型满足预设训练条件时,将所述第二图像分类模型确定为目标图像分类模型;

将待测图像输入至所述目标图像分类模型,得到所述待测图像的图像分类结果。

本发明的基于自蒸馏的图像分类方法的有益效果如下:

本发明的方法不需要单独训练教师网络,能够利用模型自身的注意力图进行蒸馏,在有效压缩图像分类模型训练时间的同时,确保了图像分类的效果不受影响。

在上述方案的基础上,本发明的基于自蒸馏的图像分类方法还可以做如下改进。

进一步,所述特征处理模块包括:依次连接设置的通道维度的第一平均池化层和第一L2归一化层;

所述将所述输出特征图输入至特征处理模块,得到该图像样本的原始特征图的步骤,包括:

将所述输出特征图依次通过所述通道维度的第一平均池化层和所述第一L2归一化层进行通道维度平均池化处理和L2归一化处理,得到该图像样本的原始特征图。

进一步,所述注意力机制模块包括:全局平均池化层、节点权重计算模块、通道维度的第二平均池化层和第二L2归一化层;

所述将所述输出特征图输入至注意力机制模块,得到该图像样本的注意力特征图的步骤,包括:

将所述输出特征图输入至所述所述全局平均池化层进行全局平均池化处理,得到第一特征图;

通过所述节点权重计算模块获取所述第一特征图的正确预测节点所对应的权重,并将所述第一特征图的正确预测节点所对应的权重与所述输出特征图相乘,得到第二特征图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数美时代科技有限公司;数美天下(北京)科技有限公司,未经北京数美时代科技有限公司;数美天下(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310071832.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top