[发明专利]一种面向发电设备高维时序工况数据的异常检测方法有效
申请号: | 202110378432.6 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113111096B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 周东;李晋航;石致远;陈兵;韩鑫;高铭泽 | 申请(专利权)人: | 东方电气集团科学技术研究院有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F17/16;G06Q50/06;G06N3/0455;G06N3/08;G06Q10/20 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 蒋斯琪 |
地址: | 610000 四川省成都市中国(四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 发电 设备 时序 工况 数据 异常 检测 方法 | ||
本发明公开了一种面向发电设备高维时序工况数据的异常检测方法,首先利用包括四分位差法的数据清洗方法去除差异化大的利群点;再通过特征构架器和统计学来构建相应数据特征,最后通过深度学习中的自编码器方法来重建数据特征;将重建数据特征和基于onehot的设备工作状态的场景信息级联融合;经深度学习全连接层推理生成重建数据,将原始数据特征和重建数据特征进行阈值判断,从而判断出是否存在异常。本发明在实现过程中,减少了高维数据的复杂运算以及明显提高了对传感器故障等数据异常的检测效果,同时简单实用,无过多经验阈值判断,并且可实现多种传感器的故障数据异常检测具备通用性,其中无高维矩阵运算,计算量小,检测精度高。
技术领域
本发明涉及智慧电厂发电设备领域,尤其是针对锅炉设备中磨煤机传感器设备的采集数据,具体是一种面向发电设备高维时序工况数据的异常检测方法。
背景技术
在当今大数据智慧化时代下,智慧电厂就是在数字化电厂的基础之上,利用互联网、物联网、人工智能、大数据分析等信息化、虚拟现实等技术,对电厂系统和数据进行深入挖掘,最终达到智能化生产运营。而其中智慧电厂最根本的就是需要从发电设备上的传感器读取大量数据。传感器设备采集并积累了大量发电设备的时间序列数据,这些数据具有模式多样、工况多变的特性,并且由于设备通讯中断等种种情况导致该数据具有相当数量的异常,如果进行直接分析会给后续的故障诊断等应用带来巨大的麻烦。因此加入异常检测,去除异常数据,保障后续数据应用的正确性是有重大意义的。
目前针对大数据的异常检测的方法主要包括:基于统计学、基于机器学习和基于相关性。其中:1)基于统计学的检测,是最直观也最容易的方法,通常来说:假设原数据服从某个分布(如高斯分布),然后计算μ和再计算的区间,最后落在区间之外的数据点就被认为是异常值。高斯分布概率密度函数公式如下所示:
其思想是落在尾部分布的数据概率很小,几乎不可能出现;一旦出现了就认为该数据是异常的,实际应用中更多的是使用混合分布。2)基于机器学习或深度学习的数据异常检测,是把异常检测看成是数据不平衡下的分类问题,即通过找出与正常数据集差异较大的离群点。把离群点作为异常点的方式,一般来说,异常数据的样本量都是少量甚至不存在异常数据样本,所以采用的机器学习都是半监督或者无监督异常检测模型。3)基于相关性的异常检测,是基于序列相关性分析的异常检测方法。该方法是对数据进行相关性计算得到相关性矩阵,提取量化的相关关系;根据相关性矩阵建立了相应的数据模型,通过数学模型进行时序上的单维异常检测。
如果有充分的数据和检验类型的先验知识,基于统计学的方法对单个属性的离群点检测可能非常有效。但对于多元数据,可用的模型较少,且对于高维数据,检验的性能可能很差。基于机器学习的异常检测在模型训练以及在线推理的时候都会遇到问题,首先在模型训练时针对有监督训练需要足够的样本而实际异常样本量不足,只能采用弱监督或者无监督训练;而无监督训练在针对一次识别一个异常的技术常常遇到屏蔽的问题,即如果有一场成群结对出现,可能会被无监督算法等视为正常的一簇点。一次检测多个异常的技术可能陷入泥潭,即把一堆正常的点判为利群点。
发明内容
本发明目的在于解决在发电锅炉中高维时序数据的异常问题,提供了一种面向发电设备高维时序工况数据的异常检测方法,主要应用于发电设备中具有时序性的大数据的异常检测,减少异常数据对决策的影响。本发明相较于传统的数据异常检测方法,具有检测精度高、检测快速等特点,还具备检测传感器通讯等故障引发的数据异常的能力。
本发明的技术内容如下:
一种面向发电设备高维时序工况数据的异常检测方法,其特征在于步骤如下:
(1)获取原始数据;所述原始数据维度为m*n的二维矩阵,其中m代表周期数,n代表特征数即传感器数量,原始数据物理含义就是m个连续周期下n维特征的特征值,通常情况下m10000,n10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东方电气集团科学技术研究院有限公司,未经东方电气集团科学技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110378432.6/2.html,转载请声明来源钻瓜专利网。