[发明专利]一种基于两阶段序列特征学习的网络流量分类方法及系统有效
申请号: | 201711205047.1 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108199863B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 叶晓舟;王伟;曾学文 | 申请(专利权)人: | 中国科学院声学研究所;北京中科智网科技有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L12/851;H04L29/06;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 序列 特征 学习 网络流量 分类 方法 系统 | ||
1.一种基于两阶段序列特征学习的网络流量分类方法,其特征在于,包括以下步骤:
对流量字节序列进行数据包序列特征学习,确定数据包向量序列;
对所述数据包向量序列进行网络流序列特征学习处理,确定网络流向量;
根据所述网络流向量进行网络流量分类;
所述对流量字节序列进行数据包序列特征学习,确定数据包向量序列,包括:
使用长短时记忆神经网络对每个数据包的流量字节序列进行数据包序列特征学习,所述每个数据包生成一个对应的数据包向量,每个网络流生成一个对应数据包向量序列;
所述对所述数据包向量序列进行网络流序列特征学习处理,确定网络流向量,包括:
使用长短时记忆神经网络对所述每个网络流的数据包向量序列数据进行网络流序列特征学习,所述每个网络流生成一个对应的所述网络流向量。
2.根据权利要求1所述的方法,其特征在于,所述长短时记忆神经网络还包括双向结构的长短时记忆神经网络。
3.根据权利要求2所述的方法,其特征在于,所述根据所述网络流向量进行网络流量分类,包括:
根据所述网络流向量进行网络流量分类,确定每一类网络流量的概率分布。
4.根据权利要求1所述的方法,其特征在于,在所述对流量字节序列进行数据包序列特征学习,确定数据包向量序列的步骤之前,还包括:
按照网络流形式对网络流量数据进行预处理,得到一组网络流单元;
对每个所述网络流单元进行编码,得到长短时记忆神经网络要求的数据格式,所述编码方式包括:独热编码或嵌入编码,编码后每个数据包形成一个长度固定和维数固定的向量序列。
5.根据权利要求4所述的方法,其特征在于,包括:
所述网络流为双向通信的网络流,所述网络流量数据为包含协议层的流量数据;
所述网络流的每个数据包需要统一为固定长度,所述网络流的数据包需要统一为固定个数。
6.一种基于两阶段序列特征学习的网络流量分类系统,其特征在于,该系统包括:
第一学习模块,用于对流量字节序列进行数据包序列特征学习,确定数据包向量序列;包括:使用长短时记忆神经网络对每个数据包的流量字节序列进行数据包序列特征学习,所述每个数据包生成一个对应的数据包向量,每个网络流生成一个对应数据包向量序列;
第二学习模块,用于对所述数据包向量序列进行网络流序列特征学习处理,确定网络流向量;包括:使用长短时记忆神经网络对所述每个网络流的数据包向量序列数据进行网络流序列特征学习,所述每个网络流生成一个对应的所述网络流向量;
分类模块,用于根据所述网络流向量进行网络流量分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科智网科技有限公司,未经中国科学院声学研究所;北京中科智网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711205047.1/1.html,转载请声明来源钻瓜专利网。