[发明专利]一种网络流量分类方法有效
申请号: | 201811535347.0 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109726744B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 赵世林;叶可江;须成忠 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 范盈 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络流量 分类 方法 | ||
1.一种网络流量分类方法,其特征在于:所述方法包括如下步骤:
步骤1、采集网络流量样本数据;
步骤2、对样本数据进行预处理,得到样本数据集;
步骤3、对所述样本数据集中的样本数据打标签,得到标签数据集;
步骤4、将所述标签数据集和未知标签数据集整合,得到混合训练数据集;
步骤5、对所述标签数据集的网络流进行分层协议特征提取,得到特征流数据集;
步骤6、采用聚类算法对所述混合训练数据集和所述特征流数据集进行训练建模和测试验证;
步骤7、输出分类结果。
2.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤1包括如下步骤:
101、选择数据库;
102、监控所述数据库中的已知网络应用流量和未知网络应用流量;
103、捕捉所有应用流量信息,采集样本数据。
3.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤1中样本数据包括已知网络数据包和网络日志,所述样本数据包括未知网络数据包和网络日志。
4.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤2对样本数据进行预处理包括清洗样本数据流量,去除不规则的数据包。
5.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤3对样本数据打标签包括找出已知网络应用流量的IP地址、端口号和传输协议;通过查找网络日志中与已知网络应用关联的IP地址和端口号,完成标签匹配,得到扩充流标签数据集。
6.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤4将有标签的数据集和未知标签的数据集整合包括采用标签传播算法从未知网络包里抽取实例,通过提取已打标签数据集和未打标签数据集的目的IP、目的端口号和传输协议,进行同源匹配;得到混合训练数据集。
7.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤5对标签数据集的网络流进行分层协议特征提取包括输入标签数据集,对每个标签数据进行分层协议特征提取,得到特征流数据集。
8.如权利要求1所述的网络流量分类方法,其特征在于:所述步骤6包括对所述混合训练数据集和所述特征流数据集进行聚类,然后不断迭代训练,测试训练好的分类模型。
9.如权利要求1~8中任一项所述的网络流量分类方法,其特征在于:所述步骤2中样本数据包括未知流量和已知流量。
10.如权利要求9所述的网络流量分类方法,其特征在于:所述步骤3对样本数据打标签包括对已知应用流量样本数据打标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811535347.0/1.html,转载请声明来源钻瓜专利网。