[发明专利]大规模输变电设备监测数据流的快速异常检测方法在审
| 申请号: | 201711188381.0 | 申请日: | 2017-11-24 |
| 公开(公告)号: | CN107846472A | 公开(公告)日: | 2018-03-27 |
| 发明(设计)人: | 宋亚奇;李莉 | 申请(专利权)人: | 华北电力大学(保定) |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08;G06K9/62 |
| 代理公司: | 石家庄开言知识产权代理事务所(普通合伙)13127 | 代理人: | 赵俊娇 |
| 地址: | 071003 河*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 大规模 变电 设备 监测 数据流 快速 异常 检测 方法 | ||
1.一种大规模输变电设备监测数据流的快速异常检测方法,其特征在于,该方法借助使用DBScan算法对历史数据进行聚类和类别标记,并将标记后的样本发送至SparkStreaming集群,用于实时增量聚类;而前置机接收各种终端发送过来的数据流,并将数据流推送到Spark Steaming集群处理,在Spark Steaming集群上完成实时特征提取及归一化处理;然后进行实时聚类,以完成对新样本类别的判断。
2.根据权利要求1所述的一种大规模输变电设备监测数据流的快速异常检测方法,其特征在于,包含以下几个步骤:
(1)前置机接收各种终端发送过来的数据流,并将数据流推送到Spark Steaming集群处理,利用StreamingContext的socketTextStream方法,在服务器指定端口接收数据流,并将接收的文本数据流转换为DStreams;
(2)在Spark Steaming集群上,对监测数据进行归一化处理;
(3)使用DBScan算法对历史数据进行聚类和类别标记:
该步骤是在批量计算模式下,使用DBscan算法对历史数据进行聚类,从而形成初始类簇,其为每个类簇进行编号,并对每个数据点使用类簇编号进行标记;
(4)将重新标记和定义后的样本集发送至SparkStreaming平台,并且使用广播方式,将新样本集发送至集群所有数据节点,用于后续的增量聚类;
(5)对实时到达的监测数据,进行数据特征提取和归一化处理,形成可以用于参与增量聚类的数据样本M(m1,m2,..mn);
(6)对生成的数据样本M(m1,m2,..mn),在SparkStreaming平台上,执行增量DBScan算法,实时确定样本所属聚类。
3.根据权利要求2所述的一种大规模输变电设备监测数据流的快速异常检测方法,其特征在于,在步骤(2)中,是使用min-max离差标准化方法对原始采样数据data进行线性变换,使结果result映射到[0,1]之间,以消除量纲影响。
4.根据权利要求3所述的一种大规模输变电设备监测数据流的快速异常检测方法,其特征在于,其映射公式为公式(1);
公式(1)中,datamax为样本数据最大值,datamin为样本数据最小值。在有新数据加入时,会实时更新datamax和datamin。
5.根据权利要求2所述的一种大规模输变电设备监测数据流的快速异常检测方法,其特征在于,在步骤(3)中,是使用三元组的格式重新定义每个数据样本,其公式为:
X=<(x1,x2,..xn),y,z>(2)
其中,公式(2)中,(x1,x2,..xn)为n维采样值,y为采样点所属类簇编号,z为数据点的类型,包括核心点、边缘点和异常点3种类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定),未经华北电力大学(保定)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711188381.0/1.html,转载请声明来源钻瓜专利网。





