[发明专利]一种基于SDN架构的业务识别方法有效
申请号: | 201810251707.8 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108460423B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 潘成胜;杨力;魏德斌;石怀峰;刘勇 | 申请(专利权)人: | 大连大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 盖小静 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 sdn 架构 业务 识别 方法 | ||
1.一种基于SDN架构的业务识别方法,其特征在于,具体包括以下步骤:
A、设计一种在线学习框架;
B、筛选适用于空间信息网络的在线流流量分类特征;
C、训练分类器;
一种在线学习框架,包括离线训练和在线分类两个阶段;
离线训练阶段:获取实时业务流量数据作为训练集,通过提取流量特征和对样本进行部分标记,实现基于Dif-TriTraining算法的训练分类器;所述Dif-TriTraining算法是以一定比例选取样本集中距离较小的样本,将选取出的样本放入主分类器数据集中再次进行训练得到最终的分类器;
在线分类阶段:抓取实时网络流量并进行特征提取,使用分类器进行流量分类,以获得分类结果;
在线流流量分类特征包括:(1)基于包的统计特征的选取:把选取流中前N个数据包作为一条子流,统计子流中最大包、最小包、平均包的大小、平均到达时间间隔的均值作为统计特征;(2)基于流的统计特征的选取:流大小、流的持续时间,相邻两数据包到达时间间隔最小值作为统计特征;
训练分类器的具体步骤如下:假设初始已标记样本集为L,未标记样本集为U;
C1、采用可放回随机抽样方法从初始已标记样本集L中获取三个有差异性的已标记样本集,再使用分类算法对这三个有标记数据集进行训练,得到三个初始分类器A、B、C;
C2、选择其中任意一个为主分类器,假设A为主分类器,B和C为辅助分类器,然后利用辅助分类器B和C对未标记样本集U进行分类,做分类结果标记,将标记相同的样本与相应的标记组合成集合Xa;统计集合Xa样本个数,假设为K1;
C3、计算每个样本xi属于Xa的样本差距;样本差距计算公式如下:
其中,dis(xi)表示样本xi的样本差距,N是样本的维度,xik表示xi第k维上的值;
C4、从Xa中选择K2个dis(xi)值最小的样本,根据辅助分累器的分类结果进行标记,并将标记后的样本加入主分类器对应的已标记样本集进行扩展,然后重新训练该分类器,获得Xa';K2的计算公式为:
K2=[select_rate*K1]
其中,select_rate∈(0,1)是样本差异较小的样本所占比例;
C5、训练结束,Xa'则为训练后最终的分类器。
2.根据权利要求1所述一种基于SDN架构的业务识别方法,其特征在于,上述方法是在空间信息网络架构中实施的,将空间信息网络控制平面和转发平面分离,该架构包括应用层面、控制层面和转发层面组成。
3.根据权利要求2所述一种基于SDN架构的业务识别方法,其特征在于,在空间信息网络架构下,使用在控制层面在线收集OpenFlow交换机转发过来的数据包并进行特征统计使用分类器来进行业务分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810251707.8/1.html,转载请声明来源钻瓜专利网。