[发明专利]一种基于壳向量式SVM增量学习模型的流量实时分类方法在审
申请号: | 201910045138.6 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109871872A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 曲桦;赵季红;蒋杰;张艳鹏 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 增量学习 训练集 向量 实时分类 实时网络流量 网络流量分类 数据预处理 不确定性 降维处理 冗余特征 算法删除 线性叠加 新样本 并集 高维 算法 对称 违反 | ||
1.一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,包括以下步骤:
1)对初始训练数据按特征维度分别进行归一化得到初始特征集FT1;
2)对初始特征集FT1采用FCBF算法进行特征选取,删除冗余特征和不相关特征得到优化特征集FT2:
3)对优化特征集FT2采用PCA算法进行处理,实现特征提取操作得到特征集FT3,将主要信息集中在少数维度;
4)以特征集FT3训练SVM模型,得到初始模型,使用初始模型对网络流量分类并得到含有样本几何信息的壳向量集合;
5)在实现增量学习过程中,根据新网络流量的信息和壳向量来更新模型;
6)使用更新后的模型进行网络流量实时在线分类。
2.根据权利要求1所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,所述步骤1)中,按特征维度进行归一化是对初始训练数据中每一维特征分别进行线性变换,使每一维特征值在保持原有数据意义下映射到[0,1]之间,消除各维度特征值量纲差别带来的影响,从而得到归一化后的特征集,表示为其中包含n个样本,每个样本有d个维度。
3.根据权利要求1所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,所述步骤2)中,FCBF算法实现步骤如下:
2.1)计算每个特征Fi与目标O之间的相关性;
2.2)将相关性SU(Fi,O)大于预先设置好的阈值δ的特征选出并从大到小排列;
2.3)依次遍历降序排列中小于SU(Fi,O)的所有特征Fj并计算SU(Fi,Fj);如果SU(Fi,Fj)大于等于SU(Fj,O),则删除特征Fj;;如果SU(Fi,Fj)小于SU(Fj,O),则保留特征Fj;最后得到无重复特征的特征子集FT2。
4.根据权利要求3所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,步骤2.1)中,目标O依次取特征集的所属类别,则特征Fi与目标O之间的相关性其中IG(X,Y)=E(X)-E(X|Y),IG(X,Y)表示信息增益,E(X)、E(Y)表示信息熵,E(X|Y)表示当随机变量Y单独发生时,随机变量X发生的条件概率,P(xi)表示特征x取值为i时的概率,z为类别数。
5.根据权利要求3所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,步骤2.2)中阈值δ取值为0.02。
6.根据权利要求1所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,步骤3)中通过坐标轴的旋转实现将特征集的主要信息集中在少数维度。
7.根据权利要求1所述的一种基于壳向量式SVM增量学习模型的流量实时分类方法,其特征在于,步骤4)中壳向量集合是特征集几何意义上最边缘的数据,即特征集最外层数据,以基于最小超球概念求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910045138.6/1.html,转载请声明来源钻瓜专利网。