[发明专利]一种基于集成学习的无线传感网入侵检测方法有效
申请号: | 201711226219.3 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108093406B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 陶洋;代建建;章思青;许湘扬;梅思梦;杨飞跃;李朋;邓行;谢金辉 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | H04W12/12 | 分类号: | H04W12/12;G06K9/62;H04W84/18 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 无线 传感 入侵 检测 方法 | ||
1.一种基于集成学习的无线传感网入侵检测方法,其特征在于:该方法包括以下步骤:
S1:从层次结构无线传感网中收集到各个节点的数据,将数据进行预处理,抽取出每个节点的特征集,将符号特征转化为数值;
S2:将每一个特征值进行归一化;
S3:使用特征选择算法从预处理后的特征集筛选出最优特征集;
S4:使用改进的SVM(Support Vector Machine)算法作为弱分类器,结合筛选出来的最优特征训练集进行训练;
S5:使用Adaboost集成学习算法对训练出来的弱分类器组合起来,形成强分类器,再利用训练出来的强分类器对实际数据进行测试,分辨出无线传感网正常节点和异常节点;
所述步骤S3中,筛选出最优特征集:从层次结构无线传感网中收集到各个节点的数据,将数据进行预处理,抽取出每个节点的特征集,使用基于主成分分析方法(PrincipalComponent Analysis,PCA)的特征选择算法对安全数据维度进行降维处理,具体算法如下:
无线传感网内节点数:假设给定样本{X1,X2,...,XN},X是输入的n维特征值数据,求得其均值μ,
X的协方差矩阵为:
协方差矩阵C的特征值的解:
Cνi=λiνi
其中,λi为特征值,νi为对应的特征向量,i=1,2,...,n;
计算m个最大特征向量,m最大特征向量代表低维向量的特征值数据样本,m<n,令:
Φ=[v1,v2,...,vm]
Λ=diag[λ1,λ2,...,λm]
所以:
CΦ=ΦΛ
当精确参数k表示m最大特征向量的估计精度时,用下面的等式表示:
根据精确参数k,选择出最优的特征向量数,而精确参数k由Kaiser经验法则求得:按照相关矩阵计算出特征向量的主成分,然后取特征值超过1的对应特征向量的主成分;
所述步骤S4中,先对SVM算法的核函数进行改进,使SVM能处理非线性数据,将数据映射到高维空间,然后将改进的SVM算法作为弱分类器;
将处理后的n条特征集作为训练集其对应的标记数据集为y1,y2,…,yn∈{-1,1},其-1代表被入侵的数据,1代表正常节点数据;初始化训练集的权重分布,第一次迭代开始对每一个训练集赋予相同的权重,D1代表第一次迭代训练集权重分布,
D1=(w11,w12,...,w1i,...,w1N),
然后结合弱分类器进行训练,在这些训练集中找到一个最大边距的超平面,用于区分出正常节点和非正常节点;
假设M为超平面的边距,为了最大化M:
是超平面的法向量,表示从输入空间到特征空间的映射,其中
(1)式等价于:
(2)式等价于:
引入Soft Margin软边距代替Hard Margin硬边距,因此
其中是允许惩罚违反约束限制的松弛变量,C是用于权衡大边距和约束之间的控制参数;
为了增加SVM对非线性数据的处理性能,需要对其设置核函数,假设从输入空间到特征空间的映射可以通过一个向量参数p去找到一个向量参数p和最大边距的超平面,不同向量参数p对应不同的特征空间,由于在两个不同的特征空间中不能直接比较,需要对边距进行归一化处理:
如果p是固定的,则找到最大边距的超平面的归一化边距等价于找到最大的正常边距,让则表示为
(4)式等价于:
(5)式等价于:
引入Soft Margin软边距去代替Hard Margin硬边距,因此
最后求得分离超平面为:
相对应的分类决策函数为:
计算出得到最大的边距;
所述步骤S5中,将弱分类器设为Gm(x),计算出弱分类器得到的超平面分类器在训练集中的分类误差率em:
误差率em就是被Gm(x)错误分类的权重之和,
然后,计算出Gm(x)在最终分类器的权重αm:
这样完成第一次迭代,然后重新更新训练集中权重分布,进行下一步迭代:
Dm+1=(wm+1,1,wm+1,2,...,wm+1,i,...,wm+1,N),i=1,2,...,N
随着不停的迭代算法训练之后,被弱分类器错误分类的训练样本的权重会增大,而被正确分类的样本的权重会减少,其中为归一化因子,使Dm+1成为一个概率分布;
最后将训练出来的弱分类器组装起来:
得到强分类器:
再利用训练出来的强分类器对实际数据进行测试,分辨出无线传感网正常节点和异常节点。
2.如权利要求1所述的一种基于集成学习的无线传感网入侵检测方法,其特征在于:所述步骤S2中,将收集到的特征值利用公式进行归一化处理,其中i(x)表示未经过归一化的特征值,Vmin(x)表示未经过归一化的特征值的最小值,Vmax(x)表示未经过归一化的特征值的最大值,Ni(x)表示归一化后的特征值,范围在0~1之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711226219.3/1.html,转载请声明来源钻瓜专利网。