[发明专利]一种基于在线对比蒸馏网络的广义持续分类方法在审

专利信息
申请号: 202210326319.8 申请日: 2022-03-30
公开(公告)号: CN114972839A 公开(公告)日: 2022-08-30
发明(设计)人: 冀中;黎晋 申请(专利权)人: 天津大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 张建中
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 在线 对比 蒸馏 网络 广义 持续 分类 方法
【说明书】:

发明公开了一种基于在线对比蒸馏网络的广义持续分类方法,建立基于知识蒸馏的分类模型;建立缓冲区并利用蓄水池采样法更新缓冲区;从缓冲区中随机采样S个样本并分别输入到教师和学生模型中,得到对应两者模型的分类输出和特征嵌入;计算并依据教师模型分类输出质量分数,调节不同样本的知识蒸馏损失函数权重并计算蒸馏损失对两者模型间的特征嵌入进行对比,计算两者模型的对比关系蒸馏损失计算学生模型自监督损失和监督对比学习损失计算学生模型交叉熵分类损失将上述损失加权相加确定最大优化目标优化学生模型的参数。由学生模型的参数来更新教师模型的参数。本发明对新任务和旧任务都有很好的分类准确率。

技术领域

本发明涉及一种广义持续分类方法,特别涉及一种基于在线对比蒸馏网络的广义持续分类方法。

背景技术

目前,近些年来,深度学习在图像分类、目标检测和语义分割等计算机视觉任务已经取得了很好的效果。然而,当在旧任务训练好的神经网络直接在新任务上训练时,新任务会严重干扰旧任务的性能,产生灾难性遗忘(Catastrophic Forgetting)问题。让神经网络从头开始训练显然会耗费更多的时间和计算资源,并且先前任务的数据由于隐私性等问题也不一定是再次获取的。人类拥有持续不断学习的能力,能在旧知识的基础上快速地学习新知识,而不会破坏先前学习知识的稳定性。我们希望神经网络能够具备人类这种持续不断学习的能力,持续学习(Continual Learning),也叫作增量学习(IncrementalLearning)就是为克服灾难性遗忘问题而提出的。近些年来,大量持续学习的工作采用了经验回放(Experience Replay)的思想,存储一部分旧任务的样本,在训练新任务时对存储的样本进行回放,以此来缓解灾难性遗忘问题。

在现有的持续学习技术中,往往需要假定各个任务之间的类别是互不相交的,即新任务中的类别都是旧任务中没有出现过的,任务之间就存在清晰的任务边界,在现实世界的任务中这种先验知识极有可能是不存在的。现有的很多技术利用了这种现实任务中不太可能出现的先验知识,简化了持续学习问题的难度。例如,利用旧样本在过去时刻的模型输出正则旧样本在当前时刻的模型输出来缓解灾难性遗忘时,旧模型输出的维数和新模型输出的维数由于新类别的到来而变得不一致,在假设任务间类别互补想交的情况下,可以让新模型的输出只正则和旧模型相重合的一部分。以往利用任务间类别互不相交的持续方法就无法应用到广义持续学习的设置下。为此,在现实场景中解决灾难性遗忘问题的广义持续学习(General Continual Learning)技术逐渐受到关注。广义持续学习的目标是从非平稳的无限数据流中巩固所学知识,并快速地学习新知识。在广义持续学习的设置下,每个任务之间的类别可能是相交的,新任务中可能会出现旧类新样本,以往借助现实世界中并不一定存在的先验知识来解决持续学习的方法就很难应用到广义持续学习中。

广义持续学习是一种通用的持续学习场景,它也可以应用到经典的类增量学习(Class Incremental Learning)、任务增量学习(Task Incremental Learning)和领域增量学习(Domain Incremental Learning)场景中。但是在广义持续学习的场景下进行图像分类时不能利用这些经典场景中特定的先验知识来缓解灾难性遗忘。这就意味着,在经验回放时,必须挖掘一些固有的非特定场景的信息来巩固旧任务的知识。

发明内容

本发明为解决公知技术中存在的技术问题而提供一种基于在线对比蒸馏网络的广义持续分类方法。

本发明为解决公知技术中存在的技术问题所采取的技术方案是:一种基于在线对比蒸馏网络的广义持续分类方法,包括如下步骤:

步骤1,建立基于知识蒸馏的分类模型,该分类模型中包括教师模型和学生模型;教师模型和学生模型均设有特征编码器、分类器和特征映射器;设置学生模型的优化目标;初始化教师模型和学生模型的参数并赋予一个固定大小的缓冲区;

步骤2,当包含R个样本的一个批次数据流到来时,统计当前所遇到的样本数量,利用蓄水池采样的方法更新缓冲区;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210326319.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top