[发明专利]一种映射隔离森林的无线传感器网络异常数据检测方法有效
| 申请号: | 202010116954.4 | 申请日: | 2020-02-25 |
| 公开(公告)号: | CN111314910B | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 屈洪春;李宗兰 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | H04W12/121 | 分类号: | H04W12/121;H04W84/18;H04W24/04 |
| 代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 杨柳岸 |
| 地址: | 400065 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 映射 隔离 森林 无线 传感器 网络 异常 数据 检测 方法 | ||
1.一种映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,该方法具体包括以下步骤:
S1:采集感知数据,定义训练数据;
S2:数据归一化,将训练数据通过z-score标准化方法进行归一化;
S3:使用随机哈希函数得到降维后的新数据集,具体包括:
S31:计算归一化后训练数据对应的随机哈希函数:
其中,α是从满足p-稳定分布函数中随机抽样得到的q维向量,β是一个在上均匀分布的随机变量;哈希函数hα,β(υ):Rq→Z能把一个q维向量υ映射到整数集上;为向下取整操作;数据集经过L个随机哈希函数h=(h1(υ),h2(υ),...hL(υ))降维映射后得到一个L维向量V=(v1,v2,...vL);
S32:根据以下主、次哈希函数G1、G2公式计算得到主、次哈希函数的值g1、g2:
S4:使用主次哈希函数将新数据集映射分桶,具体包括:
S41:比较主次哈希函数值,若g1=g2,将对应的数据点分到同一个桶内;
S42:对N个桶内哈希值点数进行统计数量,若桶内数量大于等于隔离森林子采样大小,则筛选出满足条件的所有的桶;将筛选出的桶内的点所对应的索引号排序,并从[V]n*L中选出索引号中一一对应的每一条记录,从而组成桶所对应的经过降维子采样的新数据集[A]k*L,kn;
S5:计算数据的维度均值,再计算给定降维分桶后新数据集的维度均值;
S6:比较降维前后数据的维度均值,选出均值差最大的维度作为分割属性,分割属性对应的降维维度均值作为分割点;
S7:隔离森林依据分割属性和分割点来分割数据构建隔离树,并根据树的限制高度来提前结束树的构建过程;
S8:将实时数据点经归一化、降维后,依次放入构建的隔离森林中,计算每个数据点的路径长度和异常得分;
S9:将异常得分与阈值进行比较,判定数据点是否为异常点。
2.根据权利要求1所述的一种映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S1具体包括:假设无线传感器网络节点S={Sj:j=1,2,…m}每隔一个固定时间间隔Δt,各个节点收集一组感知数据并将其发送给基站;节点Sj记录的一组感知数据是一个p维的向量vj=(vj1,vj2,…vjp),vj∈Rp,其中p表示感知数据的类型数;在下一个Δt内,基站将收到n组感知数据V={v1,v2,…vn},其中组数n与节点ID无关;
定义感知数据集V的维度均值为其中其中时间t是检测特征的接收时间;定义时间段[0,T]内收到的检测特征集为训练数据,其表示为矩阵XT={x1,x2,..,xk},k=T/Δt。
3.根据权利要求2所述的一种映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S5中,计算新数据集的维度均值具体包括:将新数据集[A]k*L作为改进后的隔离森林算法的输入数据集,若有L个维度,L个维度分别计算均值Vnew,将矩阵XT的列均值μ和Vnew分别对应索引后,求出均值差MLi,找出MLi最大值对应的属性Li作为分割属性,Vnewi作为分割点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010116954.4/1.html,转载请声明来源钻瓜专利网。





