[发明专利]一种用于知识蒸馏的边界样本数据增强方法及装置在审

专利信息
申请号: 202111568400.9 申请日: 2021-12-21
公开(公告)号: CN114219042A 公开(公告)日: 2022-03-22
发明(设计)人: 张春慨;姜茗译;韩培义;刘川意;段少明 申请(专利权)人: 哈尔滨工业大学(深圳)
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 深圳市添源创鑫知识产权代理有限公司 44855 代理人: 陈华兴
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 知识 蒸馏 边界 样本 数据 增强 方法 装置
【说明书】:

发明公开了一种用于知识蒸馏的边界样本数据增强方法、装置及计算机存储介质,该方法包括:在知识蒸馏进行前,利用教师模型对样本的输出,对每一个原始数据集中的样本沿教师模型的决策边界进行逐步迭代的修改,扩充出多个适合用于知识蒸馏的边界样本。在每轮迭代中,使用原始样本或上轮修改出的每个样本作为基础样本,利用教师模型的输出求出该样本附近决策边界的近似切面,在该切面上沿多个方向修改样本;随后对该修改后的样本进行边界化修改使之位于边界附近;最后,挑选与其他基础样本距离最远的数个样本作为该轮修改的结果以及下轮迭代修改的基础样本。本发明能够满足当前图像分类器知识蒸馏中对数据增强的需求。

技术领域

本申请涉及深度网络中知识蒸馏训练的数据增强,具体地涉及一种用于知识蒸馏的边界样本数据增强方法及装置。

背景技术

随着对深度神经网络(DNN)的研究的深入,深度网络被应用于越来越复杂的问题上,网络的深度与广度也变得越来越大。然而,庞大的参数规模不仅会导致训练上的困难,也会大大增加推理阶段花费的时间,使得网络模型无法部署在个人电脑等计算力较弱的设备上。因此,很多最近的工作都致力于研究如何将庞大的深度网络压缩为更轻量的网络,而方法之一就是知识蒸馏(KD)。

知识蒸馏是一种知识迁移的实现方式,它通过使用已经训练好的复杂模型的输出来训练简单模型,以此达到模型压缩和提升简单模型准确率的效果。在这一过程中,复杂模型被称为教师模型而简单模型被称为学生模型。由于知识蒸馏实际上是学生模型学习教师模型决策边界的过程,越靠近决策边界的样本学习的效率越高。虽然知识蒸馏最大的信息来源是教师模型,但仍然依赖适合的训练数据以完成知识从教师到学生的迁移。在实际应用中,由于进行知识蒸馏的人员并不一定是教师模型的训练方,经常会出现虽然可以获取到教师模型,却无法收集到足量用于知识蒸馏的数据的情况。此时就需要进行数据增强(Data Augmentation)以扩充数据集。

数据增强又称数据扩增,指通过实际采集数据以外的方式,使用现有的数据生成更多有助于机器学习模型训练的数据。通俗的讲,数据增强是使用已有的训练数据进行加工处理生成更多的训练数据的过程。数据增强能够帮助被训练模型更好的总结同种类样本上共有的特征。当数据足够多时,被训练模型才不易出现过拟合,才会拥有较好的泛化能力,在知识蒸馏中也是如此。此外,数据增强分为事先执行所有转换的线下增强,以及送入机器学习之前在批量数据上执行的线上增强。

然而,通用的数据增强方法如Cutout方法和mixup方法,由于没有利用到教师模型,扩充出的样本不能很好的满足知识蒸馏的需要。因此,如何在知识蒸馏的特定背景下进行有效的数据增强是知识蒸馏领域亟待解决的问题之一。

发明内容

本发明针对上述问题,提供了一种用于知识蒸馏的边界样本数据增强方法、装置及计算机存储介质。

本发明的第一方面,提供了一种用于知识蒸馏的数据增强方法,包括:

S1、根据原始样本在原始类别外的分类概率,得到进行边界化修改的目标类别;

S2、将样本空间中与原始类别分类概率相同的点组成决策边界面,对原始样本进行对抗攻击生成原始类别与目标类别之间的第一边界样本;

S3、将第一边界样本作为基础样本进行第一轮迭代,迭代过程S4-S5;

S4、根据基础样本所处的切面确定决策边界面上的N个方向,沿着N个方向进行基础样本修改,得到N个备选样本;

S5、对N个备选样本进行对抗攻击,生成N个第二边界样本;

S6、从第2轮迭代开始,将N个第二边界样本作为基础样本集合,对基础样本集合中的每个基础样本执行S4-S5,每个基础样本生成的N个第二边界样本中,只保留与基础样本集合中其他基础样本平均位置相距最远的1个第二边界样本,放入下一轮迭代的基础样本集合中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111568400.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top