[发明专利]一种基于类敏感特征提取的不均衡网络流量分类方法和系统在审
申请号: | 202111192489.3 | 申请日: | 2021-10-13 |
公开(公告)号: | CN114036357A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 李镇;熊刚;郭煜;苟高鹏;石俊峥;夏葳 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 敏感 特征 提取 均衡 网络流量 分类 方法 系统 | ||
1.一种基于类敏感特征提取的不均衡网络流量分类方法,其特征在于,包括以下步骤:
对原始不均衡流量数据中的每一条流进行向量化表示,得到向量化的流量数据集;
采用神经网络进行类敏感特征学习,从通道层面学习得到对不同类别具有不同敏感度的特征表示;
采用非局部机制将不同位置上的特征表示进行融合,得到重构后的流量特征表示;
将重构后的流量特征表示输入分类器,通过分类器进行网络流量分类。
2.根据权利要求1所述的方法,其特征在于,所述向量化的流量数据集表示为X=[X1,X2,...,Xn],其中Xi表示每一类的流量样本集合,i∈[1,n],共n个类别,每类的样本规模为Ni,即其中为第i类中的第j个流量样本,j∈[1,Ni]。
3.根据权利要求1所述的方法,其特征在于,所述神经网络采用ResNet网络,并在其基础上做以下改进:
最开始的卷积操作去掉利用stride和pooling进行的下采样操作,并扩充输入通道数,而空间维度的特征大小不变;
在第一个stage中不做下采样操作;在后续的stage中,将第一个ResBlock中做下采样的卷积即stride为2的卷积,用stride为1的卷积加stride为2的最大池化代替;
在每一个stage的末尾都加入一个SE块,即压缩再激活块;ResBlock通过捕捉特征之间的空间相关性来增强特征表示,SE块从通道角度改善特征表示的质量,使网络利用全局信息有选择地增强有益特征并抑制无用特征。
4.根据权利要求3所述的方法,其特征在于,设SE块的输入特征为U=[u1,u2,...,uC],uc表示将特征按照通道划分后第c个通道的特征,c∈[1,C],H×W表示特征的空间维度,C表示通道数;SE块首先进行压缩操作,使用全局平均池化操作将全局空间信息聚合到中的通道描述符然后进行激活操作,对压缩之后的结果做一个非线性变换,显式地建模通道之间的互相依赖关系。
5.根据权利要求4所述的方法,其特征在于,所述压缩操作中,通道描述符z的第c个元素通过以下公式计算:
所述激活操作后得到的特征为:
s=σ(g(z,W))=σ(W2δ(W1z))
其中,s表示激活操作后得到的特征,σ表示Sigmoid函数,δ表示ReLU函数,W1、W2表示在激活操作过程中需要学习的权重,r是限制模型复杂度的压缩比。
6.根据权利要求5所述的方法,其特征在于,SE块的最终输出为:
其中,表示在第c个通道上原本的输入特征和激活操作后得到的权重的乘积,即SE模块输出的特征,sc表示s中第c个通道对应的标量。
7.根据权利要求1所述的方法,其特征在于,所述采用非局部机制将不同位置上的特征表示进行融合,采用以下公式实现:
zi=Wzyi+xi
其中,zi是经过非局部机制后得到的新特征表示,xi是第i个位置上的特征,Wz是学习得到的权重,yi是xi和其他所有位置上的特征的运算结果,C(x)是位置的数量,f(xi,xj)是度量xi和xj之间的关联性的函数,g(xj)是为了减少计算量而对xj进行的降维操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111192489.3/1.html,转载请声明来源钻瓜专利网。