[发明专利]一种应用层协议特征的提取方法有效
| 申请号: | 200910260104.5 | 申请日: | 2009-12-25 |
| 公开(公告)号: | CN101753622A | 公开(公告)日: | 2010-06-23 |
| 发明(设计)人: | 刘荣烨 | 申请(专利权)人: | 青岛朗讯科技通讯设备有限公司 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08 |
| 代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 邵新华 |
| 地址: | 266101 山东省*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 应用 协议 特征 提取 方法 | ||
1.一种应用层协议特征的提取方法,包括以下步骤:
(1)捕获待监听的流量数据包;
(2)提取流量数据包中的频繁1项集,所述频繁1项集的长度设定为2的整数倍;
(3)采用如下合并过程将频繁k项集合并成候选k+1项集,k≥1:
b1=Lines[x]+Lines[y].substring(Lines[y].length()-1,Lines[y].length());
b2=Lines[y]+Lines[x].substring(Lines[x].length()-1,Lines[x].length());
其中,Lines[x]、Lines[y]分别为第x个和第y个频繁k项集,频繁k项集的长度为 LEN;substring(p,q)表示提取从序列的第p位开始到第q位的子序列,b1和b2为得到的 候选k+1项集,其长度为LEN+2;
(4)计算候选k+1项集的支持度support,提取满足支持度条件support≥minimum_sup 的候选k+1项集,作为频繁k+1项集;所述minimum_sup为频繁项集支持度的最小阈值;
(5)在频繁k项集中,删除频繁k+1项集包含的项集;
由步骤(3)、(4)、(5)获取的各个频繁项集即构成应用层的协议特征集合;
在所述步骤(2)的频繁1项集提取过程中,采用Bloom Filter算法来判断重复频繁1 项集,并将重复的频繁1项集删除;
在完成频繁k+1项集的提取过程后,紧接着进行删除冗余的频繁k项集的过程:
令fz为一个频繁k+1项集;fx和fy为两个频繁k项集,且fx=fz.substring(1, fz.length()-2),fy=fz.substring(3,fz.length()),那么删除频繁k项集fx和fy。
2.根据权利要求1所述的应用层协议特征的提取方法,其特征在于:在所述步骤(2) 之前包括建立流量数据包的频繁项集数据模型的过程:
令I=(i1,i2,....id},每个项ig(g=1到d)由两位十六进制数组成,是应用层流量数据包的 最小单位;
T={t1,t2,....td}为所有数据包的集合,ti={I的子集构成的序列},为一个应用层协议信 息数据包;
令S=substring(ti),S表示应用层协议信息数据包ti的一个子序列,为I的项集;
频繁项集的支持度support=P(ti(S)/R),其中,分子ti(S)表示项集S在事务中出现的 次数,分母R表示事务个数,P(ti(S)/R)表示项集S在事务中的出现频率;若Support≥ minimum_sup,则应用层流量数据包ti的子序列S为该应用层的协议特征。
3.根据权利要求1所述的应用层协议特征的提取方法,其特征在于:所述频繁1项集 的长度为2的倍数,且大于等于4。
4.根据权利要求1所述的应用层协议特征的提取方法,其特征在于:在所述步骤(2) 和(4)的频繁项集的提取过程中,包括删除不产生频繁项集的流量数据包的过程。
5.根据权利要求1至4中任一项所述的应用层协议特征的提取方法,其特征在于:在 所述步骤(1)中还包括对捕获到的流量数据包进行预处理的过程:
将捕获到流量数据包进行上行网络流量和下行网络流量的分流,只保留上行网络流量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛朗讯科技通讯设备有限公司,未经青岛朗讯科技通讯设备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910260104.5/1.html,转载请声明来源钻瓜专利网。





