[发明专利]一种基于K-mediod的物联网环境下的异常数据检测方法有效
| 申请号: | 202010759571.9 | 申请日: | 2020-07-31 |
| 公开(公告)号: | CN111860692B | 公开(公告)日: | 2022-05-31 |
| 发明(设计)人: | 梁花;杨云;徐鑫;朱珠;李洋;韩世海;晏尧;雷娟;徐镭洋;严华;李玮;张森;向菲;万凌云;戴豪礽;张伟;景钰文;於舰;侯兴哲;陈涛;宫林;周全;李松浓 | 申请(专利权)人: | 国网重庆市电力公司电力科学研究院;国家电网有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G16Y20/10;G16Y20/20;G16Y40/10;G16Y40/20 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 贺春林 |
| 地址: | 401123 重庆市渝北*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 mediod 联网 环境 异常 数据 检测 方法 | ||
1.一种基于K-mediod的物联网环境下的异常数据检测方法,其特征在于,所述方法包括:
S1:数据采集,通过传感器或电子检测设备获取互联网设备的相关信息数据;
S2:构建信息矩阵和相似性矩阵,根据获得的物联网设备信息构建物联网信息矩阵B,并计算任意两个物联网设备之间的相似度,根据得到的相似度结果构建物联网设备的相似性矩阵D;
所述信息矩阵的构建,首先分别构建出所有物联网设备信息的集合B和每个物联网设备信息的集合bp,再通过向量Vp表示bp与B之间的关系,所述关系表示中0表示不包含,1表示包含,根据所述表示关系构建出所述物联网设备信息矩阵Bnm如下所示:
其中gnm为0或1;
所述相似矩阵的构建包括如下步骤:
S41:建立一个m维的空间,再空间中存在一点,使空间原点指向该点的向量与物联网信息向量V相等,即该点可以抽象地表示物联网设备所涉及到的物联网信息;
S42:计算任意两个物联网设备Xi和Xj之间的信息相似度,通过信息在m为空间中对应的两点之间的欧几里得距离dij表示,表达式如下所示:
S43:根据计算得到的两两设备之间的相似度值dij,构建出n个物联网设备的相似度矩阵Dnm如下所示:
S3:K-mediod聚类,对构建的所述相似性矩阵D进行多次不同K值的K-mediod聚类,并记录不同的K值及其对应的聚类结果;
所述K-mediod聚类包括如下步骤:
S51:选定一个K值,根据选定的K值从所有物联网设备中随机选取K个设备作为K-mediod聚类的中心点;
S52:通过得到的相似度矩阵D,计算出剩余的物联网设备到K个中心点的距离,并将每个物联网设备分配到距离其最近的中心点;
S53:每个物联网设备分配好后,计算出每个中心点到每个物联网设备的距离总和S;
S54:从K个类簇中随机选择一个类中的非中心节点的物联网设备,来代替其中现有的一个中心点;
S55:通过所述相似度矩阵D,计算剩余的物联网设备到K个中心点的距离,并根据当前的距离重新将每个点分配到距离最近的中心点;
S56:根据分配好的物联网设备再次计算每个中心点到每个物联网设备的距离总和S′
S57:比较S和S′之间的大小,当S′小于S则将新的节点作为中心节点,并返回步骤S54再次选择执行,当S′大于S则中心点保持不变,并记录当前K值和当前聚类结果;
S4:评测分析,根据得到的聚类结果通过评测函数进行评测分析,获得最佳聚类和异常数据集。
2.根据权利要求1所述的基于K-mediod的物联网环境下的异常数据检测方法,其特征在于,所述信息数据包括物联网设备的表面温度、环境湿度、环境光强、设备噪音、电流、电压、电量、功率因子、频率、时间能够计算检测到的设备相关信息。
3.根据权利要求1所述的基于K-mediod的物联网环境下的异常数据检测方法,其特征在于,所述评测分析通过评测函数计算不同K值的K-mediod聚类结果,并选取结果值最大的以及该K值对应的聚类结果作为最佳聚类,并比较最佳聚类中K个类中的类个数,将最小类个数的类作为异常数据输出,所述评测函数如下所示:
其中f为物联网信息维度,nj为K-mediod聚类中第j个类的类中物联网设备信息的个数,K为K-mediod聚类参数,xjqp为第j类聚类结果中物联网设备信息的第p个分量,cjp为第j类的类中心的第p个分量。
4.一种基于K-mediod的物联网环境下的异常数据检测装置,其特征在于,包括:
采集模块:通过传感器及相关检测设备采集物联网设备的相关数据信息,并从设备信息中提取出特征信息;
构建模块:根据获得的数据信息构建物联网信息矩阵,根据构建的信息矩阵通过计算获得所述物联网设备之间的相似度,并构建物联网设备的相似度矩阵;
所述信息矩阵的构建,首先分别构建出所有物联网设备信息的集合B和每个物联网设备信息的集合bp,再通过向量Vp表示bp与B之间的关系,所述关系表示中0表示不包含,1表示包含,根据所述表示关系构建出所述物联网设备信息矩阵Bnm如下所示:
其中gnm为0或1;
所述相似矩阵的构建包括如下步骤:
S41:建立一个m维的空间,再空间中存在一点,使空间原点指向该点的向量与物联网信息向量V相等,即该点可以抽象地表示物联网设备所涉及到的物联网信息;
S42:计算任意两个物联网设备Xi和Xj之间的信息相似度,通过信息在m为空间中对应的两点之间的欧几里得距离dij表示,表达式如下所示:
S43:根据计算得到的两两设备之间的相似度值dij,构建出n个物联网设备的相似度矩阵Dnm如下所示:
聚类模块:从所述物联网设备中随机选取K个设备作为聚类中心点进行K-mediod聚类,并根据构建的相似度矩阵计算中心点到所述物联网设备之间的距离进行多次的迭代分配、调整,获得不同K值的聚类结果;
所述K-mediod聚类包括如下步骤:
S51:选定一个K值,根据选定的K值从所有物联网设备中随机选取K个设备作为K-mediod聚类的中心点;
S52:通过得到的相似度矩阵D,计算出剩余的物联网设备到K个中心点的距离,并将每个物联网设备分配到距离其最近的中心点;
S53:每个物联网设备分配好后,计算出每个中心点到每个物联网设备的距离总和S;
S54:从K个类簇中随机选择一个类中的非中心节点的物联网设备,来代替其中现有的一个中心点;
S55:通过所述相似度矩阵D,计算剩余的物联网设备到K个中心点的距离,并根据当前的距离重新将每个点分配到距离最近的中心点;
S56:根据分配好的物联网设备再次计算每个中心点到每个物联网设备的距离总和S′
S57:比较S和S′之间的大小,当S′小于S则将新的节点作为中心节点,并返回步骤S54再次选择执行,当S′大于S则中心点保持不变,并记录当前K值和当前聚类结果;
评测模块:对不同K值的K-mediod聚类结果通过评测函数进行计算得到聚类的结果值,选取结果值最大的K值所对应的聚类结果为最佳聚类,同时比较最佳聚类中K个类中的类个数,将最小类个数的类作为异常数据输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网重庆市电力公司电力科学研究院;国家电网有限公司,未经国网重庆市电力公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010759571.9/1.html,转载请声明来源钻瓜专利网。





