[发明专利]流量数据特征提取方法、恶意流量识别方法及网络系统有效

专利信息
申请号: 202010471395.9 申请日: 2020-05-28
公开(公告)号: CN111786951B 公开(公告)日: 2022-08-26
发明(设计)人: 陶利民;王静;崔翔 申请(专利权)人: 东方红卫星移动通信有限公司
主分类号: H04L9/40 分类号: H04L9/40;H04L41/142;G06K9/62;G06F17/16;G06N3/08
代理公司: 重庆双马智翔专利代理事务所(普通合伙) 50241 代理人: 顾晓玲;陈香兰
地址: 401120 重庆*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 流量 数据 特征 提取 方法 恶意 识别 网络 系统
【权利要求书】:

1.一种恶意流量识别方法,其特征在于,包括:

步骤A,获取多个已知类别的流量数据;

步骤B,提取每个流量数据的特征向量,为每个特征向量打上类别标签,多个打上了类别标签的特征向量组成流量数据集,将流量数据集划分为训练集和测试集;所述类别标签包括恶意和合法,具体提取每个流量数据的特征向量的方法为:

步骤S1,获取流量数据;设所述流量数据中包括m条数据流,分别从每条数据流中提取n个特征,构建矩阵X:

其中,m和n均为正整数;矩阵X中任一元素xij表示第i条数据流的第j个特征,1≤i≤m,1≤j≤n;矩阵X的n列数据与n个特征一一对应;

步骤S2,对矩阵X进行归一化处理获得特征值矩阵

步骤S3,对于特征值矩阵求取每列数据中两两元素的相似度并通过求取的m*m个相似度构建m*m维矩阵,将所述m*m维矩阵作为所述列数据对应特征的自相似性矩阵,获得n个自相似性矩阵;

步骤S4,将特征值矩阵的每列数据作为一个向量,求取每个向量的直方图,记为所述向量对应特征的特征值直方图;

取每个特征的自相似性矩阵的上三角元素,获得所述特征的特征差异直方图;

将每个特征的特征值直方图与特征差异直方图组合成表示所述特征的向量,第k个特征值直方图与第k个特征差异直方图相对应,代表样本集合第k维特征的数据分布及差异信息,将两类特征向量两两对应组合,得到每维特征的向量表示;

步骤S5, 将n个特征的向量整合成表示所述流量数据的特征向量;

步骤C,构建分类模型;利用训练集和测试集分别对分类模型进行训练和验证,直到分类模型的准确率和召回率达到预设要求,获得流量识别模型;

步骤D,获取待识别流量数据并提取特征向量,将待识别流量数据的特征向量输入流量识别模型,流量识别模型输出识别结果。

2.如权利要求1所述的恶意流量识别方法,其特征在于,在所述步骤S3中,求取每列数据中两两元素的相似度的计算公式为:

sim(xlk,xrk)=xlk-xrk

其中,sim(xlk,xrk)表示第k列数据中第l行元素xlk与第k列数据中第r行元素xrk的相似度。

3.如权利要求1所述的恶意流量识别方法,其特征在于,在所述步骤S2中,矩阵X中每个元素按照如下变换公式变换后获得特征值矩阵

min(xij)表示矩阵X的最小元素,max(xij)表示矩阵X的最大元素。

4.如权利要求1所述的恶意流量识别方法,其特征在于,n个特征为空间网络和地面网络的共性特征。

5.如权利要求1所述的恶意流量识别方法,其特征在于,在执行所述步骤C后,还包括样本平衡步骤,所述样本平衡步骤包括:

步骤一,提取接近流量识别模型决策边界的已知类别的流量数据样本;

步骤二,对所提取的样本进行聚类分析,获得位于决策边界的少数类样本;

步骤三,利用获得的位于决策边界的少数类样本生成新的少数类样本并将新生成的少数类样本加入原训练集中,构成最终的训练集;

步骤四,利用最终的训练集和测试集分别再次对分类模型进行训练和验证,直到分类模型的准确率和召回率达到预设要求,获得最终的流量识别模型。

6.如权利要求1所述的恶意流量识别方法,其特征在于,已知类别的流量数据包括演化类和/或攻击类恶意流量数据。

7.一种恶意流量检测装置,其特征在于,包括流量获取单元和处理器;所述流量获取单元获取待识别流量数据并传输至处理器;

处理器接收待识别流量数据,并执行权利要求1-6之一所述方法的步骤获得识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东方红卫星移动通信有限公司,未经东方红卫星移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010471395.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top