[发明专利]一种负样本变换方法及装置有效
申请号: | 201811635760.4 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109756494B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 黄自力;杨阳;陈舟;胡景秀;熊璐 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N3/08;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 变换 方法 装置 | ||
本发明公开了一种负样本变换方法及装置,该方法包括:通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。
技术领域
本发明涉及网络安全领域,尤其涉及一种负样本变换方法及装置。
背景技术
在网络安全领域,通常通过人工智能(artificial intelligence,AI)检测系统来判断数据流是否为恶意,若为恶意数据流,则禁止该数据流通过,以达到防御目的。AI检测系统的判断规则是通过AI模型自学习形成并更新的,AI检测系统通过对流量与日志的特征抽取后,会获取正常数据流的状态特征向量,称为正样本,以及恶意数据流的状态特征向量,称为负样本。将大量的正样本与负样本输入至AI模型进行分析后,从而学习到负样本的潜在特征,用于以后检测出具有这些特征的攻击行为。但是,现有技术中,能提供给AI模型的负样本数量较少。因此,如何对负样本进行变换,以获得更多的负样本,是一个亟待解决的问题。
发明内容
本申请实施例提供了一种负样本变换方法及装置,解决了现有技术中能提供给AI模型的负样本数量较少的问题。
本发明实施例提供一种负样本变换方法,该方法包括:
通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;所述第一负样本为所述数据流经过特征抽取形成的n维向量,n为正整数;所述行为集合中每个行为是一套对样本进行变换的规则;
通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;
通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;
将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。
可选的,所述通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值,包括:
将所述行为集合中每个行为输入所述行为选择神经网络的行为训练模型,确定出该行为的奖励值;该行为的奖励值与所述第一负样本经过该行为变化后的样本通过所述检测系统的样本判别的概率呈正相关;
将所述行为集合中每个行为的奖励值,与所述行为集合的所有行为的奖励值之和的比值,作为该行为被选择的概率值。
可选的,所述通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为,包括:
按照所述行为集合中每个行为被选择的概率值,将通过所述行为选择神经网络在所述行为集合中,进行随机选择的一个行为,作为第一行为。
可选的,所述行为集合中每个行为被选择的概率值是根据所述行为选择神经网络的第一参数值确定的;
通过所述行为选择神经网络,确定所述第一行为的第一奖励值;
通过行为评价神经网络,确定所述第一行为的第二奖励值;
根据所述第一奖励值和所述第二奖励值,更新所述第一参数值。
可选的,更新所述第一参数值之前,还包括:
所述第二奖励值是根据所述行为评价神经网络的第二参数值确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811635760.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据发送及接收方法、装置、电子设备
- 下一篇:一种邮件客户端及其邮件处理方法