[发明专利]一种深度学习对抗样本安全性评价方法在审
| 申请号: | 202211012282.8 | 申请日: | 2022-08-23 |
| 公开(公告)号: | CN115438337A | 公开(公告)日: | 2022-12-06 |
| 发明(设计)人: | 韩烨;孙治;毛得明;陈剑锋;王一凡;何秉钧 | 申请(专利权)人: | 中国电子科技网络信息安全有限公司 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62;G06N20/00 |
| 代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 管高峰 |
| 地址: | 610207 四川省成都市*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 深度 学习 对抗 样本 安全性 评价 方法 | ||
本发明公开了一种深度学习对抗样本安全性评价方法,包括以下步骤:S1.利用不同对抗样本生成策略生成不同的对抗样本集;S2.依次利用生成的各对抗样本集对待测深度学习模型进行攻击,分别计算攻击有效性评价指标;S3.为待测深度学习模型装备对抗样本防御方法,计算防御有效性评价指标,构建隶属度评价矩阵;S4.对隶属度评价矩阵中的元素进行标准化处理;S5.计算第j个防御有效性评价指标下第i个对抗样本集的贡献度;S6.计算第j个防御有效性评价指标的信息熵和测试结果一致性程度;S7.计算第j个防御有效性评价指标的权重:S8.计算对抗样本安全性综合评分。本发明能够对深处学习模型的对抗样本安全性进行全面客观的评价。
技术领域
本发明涉及深度学习技术领域,尤其涉及一种深度学习对抗样本安全性评价方法。
背景技术
近年来,随着深度学习技术的不断发展,深度学习已广泛应用于图像、文本、语音等多种数据形式的分析与处理。最新的研究结果表明,对抗样例能够比较容易地欺骗深度学习模型,使之输出错误的结果,攻击者可以通过产生人工难以分辨的对抗样例对深度学习模型进行攻击,使之不能正常工作,甚至产生攻击者想要的特定输出结果。因此,对抗样本脆弱性成为深度学习技术在安全关键领域应用的主要风险之一。
为研究对抗样本脆弱性的产生与作用机理,许多研究者相继提出了一系列利用对抗样本脆弱性对深度学习模型进行攻击的方法以及针对特定攻击的防御方法,但对于攻击与防御的效果缺乏统一、全面的评价标准,不利于在不同方法之间进行横向比较,难以得到全面客观的研究结论。
发明内容
为了解决上述问题,本发明提出一种深度学习对抗样本安全性评价方法,能够对深处学习模型的对抗样本安全性进行全面客观的评价,能够实现计算简单、层次逻辑清晰、权重指标合理、综合评价方式客观的深度学习对抗样本安全性评估,对深度学习模型对抗样本攻击与防御技术的发展具有指导作用。
本发明采用的技术方案如下:
一种深度学习对抗样本安全性评价方法,包括以下步骤:
S1.利用不同对抗样本生成策略生成不同的对抗样本集;
S2.依次利用生成的各对抗样本集对待测深度学习模型进行攻击,分别计算攻击有效性评价指标;
S3.为待测深度学习模型装备对抗样本防御方法,计算防御有效性评价指标,生成n个对抗样本集对应于m个防御有效性评价指标的数值构成隶属度评价矩阵R=(rij)n×m,其中rij为第i个对抗样本集对应的第j个防御有效性评价指标的数值;
S4.对隶属度评价矩阵R中的元素进行标准化处理,将矩阵中的每个元素除以其所在列的元素的最大值;
S5.计算第j个防御有效性评价指标下第i个对抗样本集的贡献度Pij:
S6.计算第j个防御有效性评价指标的信息熵Ej:
并计算第j个防御有效性评价指标下各对抗样本集测试结果的一致性程度dj=1-Ej;
S7.计算第j个防御有效性评价指标的权重wj:
S8.根据步骤S7中计算得到的防御有效性评价指标权重以及步骤S3中计算得到的防御有效性评价指标数值,计算装备了防御方法的待测深度学习模型对抗样本安全性综合评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技网络信息安全有限公司,未经中国电子科技网络信息安全有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211012282.8/2.html,转载请声明来源钻瓜专利网。





