[发明专利]基于ARNN-KM模型的系统数据异常检测方法在审
申请号: | 202210855389.2 | 申请日: | 2022-07-19 |
公开(公告)号: | CN115169478A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 潘艺旻;陈天予;施毓祥;黄秀华;潘坚跃 | 申请(专利权)人: | 浙江大学;浙达电力科技(杭州)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州信与义专利代理有限公司 33450 | 代理人: | 马育妙 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 arnn km 模型 系统 数据 异常 检测 方法 | ||
本发明公开了一种基于ARNN‑KM模型的系统数据异常检测方法,结合用户用电时序特点,将循环神经网络与K‑Means网络进行结合,将输入序列数据片段输入到ARNN模型中,并行化处理进行特征分析,ARNN模型采用导师驱动模型,将输出层的值进行反馈,产生循环连接;然后对并行化处理输出结果进行拼接和数据转换,利用K‑Means方法分析得到聚类结果;并根据分析结果进行用户用电异常数据的检测。本发明针对数据规模较大的特点,采用易于进行并行化处理的ARNN模型,并采用导师驱动模型,该模型将输出层的期望值(而非隐藏层的值)作为下一时刻的输入,从而消除相邻时间点隐藏层之间的连接;不仅减少了中间状态值的存储,还实现了模型输出和训练目标值之间的解耦,从而在模型训练时可以进行并行化处理。
技术领域
本发明涉及电力系统配电领域用电业务分析检测,尤其涉及一种基于ARNN-KM模型的系统数据异常检测方法。
背景技术
随着电网互联工作的开展,用电业务数据规模增大。如何利用目前先进的智能技术对业务大数据进行深度信息挖掘,成为用电管理工作的关键。
传统的机器学习方法(例如K-Means分析)使用的相似性度量方法在高维数据上的性能通常较差,且通常在大规模数据集上具有很高的计算复杂度,从而降低了运行效果。因而目前针对大规模用电数据的分析和异常检测效果不佳,给工作人员带来很大困难。
发明内容
发明目的:针对以上问题,本发明提出一种基于ARNN-KM模型的系统数据异常检测方法,将循环神经网络与K-Means网络进行结合,对用户用电数据进行特征分析,根据分析结果进行用户用电异常数据的检测。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于ARNN-KM模型的系统数据异常检测方法,包括步骤:
(1)初始化模型参数;
(2)更新输入序列数据;
(3)将输入序列数据分成N个片段,Patch_k,k=1,2,…N,确定每个片段的长度和起始点;
(4)将输入序列数据片段Patch_k输入到ARNN模型中,进行并行化处理,进行特征分析,提取特征值;所述ARNN模型为循环神经网络,采用导师驱动模型,将期望值(而非隐藏层的值)作为下一时刻的输入,产生循环连接;
(5)对N个数据片段并行化处理输出结果进行拼接;
(6)数据转换之后,利用K-Means方法分析得到聚类结果;
(7)重复步骤2~6,更新聚类分析结果;
(8)将新的聚类分析结果与以往结果进行比较,如果未发生变化则认为数据正常;否则进入步骤9进一步判断;
(9)根据用户用电数据,判断用电变化量是否大于设定阈值,如果大于阈值则认为是异常数据;否则认为是正常数据。
进一步地,每个数据片段的处理过程为:将数据片段输入到ARNN模型中,更新网络参数,直到达到最大迭代次数时输出处理结果。
进一步地,初始化模型参数包括隐藏单元个数、批处理大小、迭代次数。
进一步地,输入序列数据包括馈线与变电站关系信息、变电站与用户关系信息、用户用电信息。
进一步地,ARNN模型提取特征包括:用户类型特征、用户区域特征、用户用电时段特征。
进一步地,利用Concat层对N个数据片段并行化处理输出结果进行拼接。
有益效果:本发明将ARNN神经网络模型自动提取特征和K-Means模型简单方便的优势进行结合。针对用电数据的时序特征,采用循环网络模型,并考虑历史数据和状态对当前特征提取的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;浙达电力科技(杭州)有限公司,未经浙江大学;浙达电力科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210855389.2/2.html,转载请声明来源钻瓜专利网。