[发明专利]一种用于知识蒸馏的边界样本数据增强方法及装置在审
申请号: | 202111568400.9 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114219042A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张春慨;姜茗译;韩培义;刘川意;段少明 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 陈华兴 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 知识 蒸馏 边界 样本 数据 增强 方法 装置 | ||
1.一种用于知识蒸馏的边界样本数据增强方法,所述方法包括:
S1、根据原始样本在原始类别外的分类概率,得到进行边界化修改的目标类别;
S2、将样本空间中与原始类别分类概率相同的点组成决策边界面,对原始样本进行对抗攻击生成原始类别与目标类别之间的第一边界样本;
S3、将第一边界样本作为基础样本进行第一轮迭代,迭代过程S4-S5;
S4、根据基础样本所处的切面确定决策边界面上的N个方向,沿着N个方向进行基础样本修改,得到N个备选样本;
S5、对N个备选样本进行对抗攻击,生成N个第二边界样本;
S6、从第二轮迭代开始,将N个第二边界样本作为基础样本集合,对基础样本集合中的每个基础样本执行S4-S5,每个基础样本生成的N个第二边界样本中,只保留与基础样本集合中其他基础样本平均位置相距最远的一个第二边界样本,放入下一轮迭代的基础样本集合中;
S7、如果迭代轮次达到预定次数,迭代结束,最后一轮迭代得到的N个第二边界样本即为增强的边界样本数据。
2.根据权利要求1所述的边界样本数据增强方法,其特征在于,目标类别c被选到的概率pc基于教师模型f对目标类别的分类概率fc(xori),具体表达式为:其中原始样本xori∈[0,1]d,c0为原始类别。
3.根据权利要求1所述的边界样本数据增强方法,其特征在于,使用DeepFool算法进行对抗攻击。
4.根据权利要求1所述的边界样本数据增强方法,其特征在于,根据基础样本所处的切面确定决策边界面上的N个方向,具体方法包括:令Fc(x0)=z0所表示的面为∑0,其中x0表示第一边界样本,表示针对样本x0教师模型f对原始类别c0的分类概率,fc(x0)表示针对样本x0教师模型f对目标类别c的分类概率,z0表示样本x0到决策边界面的距离,∑0在x0处的切面Π0表达式为:x表示样本空间中的点,令向量Δx=x-x0,根据Δx值生成N个修改后仍在切面上的备选样本。
5.根据权利要求4所述的边界样本数据增强方法,其特征在于,基础样本修改的具体方法包括:将第i+1轮迭代的基础样本集合中的第i轮第j个样本记为xi,j,随机对xi,j的两个维度进行修改,针对第i+1轮迭代的基础样本集合共进行N次修改,第k次修改量Δxk需满足:其中表示针对样本xi,j教师模型f对原始类别c0的分类概率,fc(xi,j)表示针对样本xi,j教师模型f对目标类别c的分类概率。
6.根据权利要求5所述的边界样本数据增强方法,其特征在于,每个基础样本生成的N个第二边界样本中,只保留与基础样本集合中其他基础样本平均位置相距最远的1个第二边界样本,具体表达式为:其中第i+1轮迭代的基础样本集合中的第i轮第l个基础样本xi,1生成的N个第二边界样本中的第k个第二边界样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111568400.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种洋葱充氮保鲜工艺
- 下一篇:一种小区物业管理用草坪修剪装置