[发明专利]一种多变量水质参数时序数据异常事件检测方法有效
申请号: | 201710007484.6 | 申请日: | 2017-01-05 |
公开(公告)号: | CN106872657B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 毛莺池;齐海;钟海士;王龙宝;平萍;戚荣志 | 申请(专利权)人: | 河海大学 |
主分类号: | G01N33/18 | 分类号: | G01N33/18;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多变 水质 参数 时序 数据 异常 事件 检测 方法 | ||
1.一种多变量水质参数时序数据异常事件检测方法,其特征在于,包括以下步骤:
(1)BP模型模拟水质参数:输入6个水质参数进行建模,训练和构造数据驱动的预测模型,分析供水管网中的多变量水质时序数据,并对模型进行评估;其中6个水质参数分别是游离氯、总有机碳(Total Organic Carbon,TOC)、电导率(Electrical Conductivity,EC)、PH值、温度和浊度,数据驱动的预测模型为BP模型;
(2)误差评估与分类:通过BP模型预测获得水质数据的预测值,然后对供水管网中实时水质参数进行测量,比较当前状态的实测值和利用预测模型得到的预测值进行误差评估和分类分析;
(3)确定单变量参数异常事件:基于误差结果的分类,通过序贯更新贝叶斯更新确定单变量水质参数的事件概率;
(4)多变量融合决策:来自多个水质监测指标的信息融合,提供统一的决策结果,确定供水管网在具体节点处是否异常事件发生;
多变量融合决策具体步骤如下:
(4.1)对6个水质参数指标分配各自的权重,在每个时间段,通过融合单变量的事件概率计算多参数变量的事件概率;
(4.2)本发明将污染异常事件发生的阈值概率设为PThreshold=0.7;每个水质参数事件更新的概率超过此阈值0.7,表示在这一段时间间隔,该单变量参数有异常事件发生;
(4.3)经过实验,确定当在一段时间内,供水管网中某个节点有3个或3个以上的水质参数经过序贯贝叶斯更新,概率超过给定的阈值PThreshold=0.7时,经过融合决定,发出预警,认为在该节点发生了水质污染异常事件。
2.根据权利要求1所述的多变量水质参数时序数据异常事件检测方法,其特征在于,所述内容(1)输入6个水质参数建模,训练和构造数据驱动的预测模型,分析供水管网中的多变量水质时序数据,并对模型进行评估;BP模型模拟水质参数的具体步骤如下:
(1.1)构建BP网络:公式为其中wjk、wij表示权重,w0、w0j表示偏差,和分别为激活函数与输出函数,fk(x;w)用于估计目标值;
(1.2)分别为6个目标水质参数构造和训练BP模型,每个BP模型的输入参数包括在测量时间段的某一时刻其他5个预测参数的数据和目标水质参数前一时刻的数据;公式为:
3.根据权利要求1所述的多变量水质参数时序数据异常事件检测方法,其特征在于,所述内容(2)误差评估与分类:通过BP模型预测获得水质数据的预测值,然后对供水管网中实时水质参数进行测量,比较当前状态的实测值和利用预测模型得到的预测值进行误差评估和分类分析;误差评估与分类的具体步骤如下:
(2.1)根据步骤(1)构造的BP模型预测计算水质数据的预测值,与获得的供水管网中实时水质参数测量值进行比较,做误差估计;预测值与测量值的估计误差公式为其中xi(t)和表示水质参数在时刻t的测量值和估计值,f(·)由步骤(1)中的BP模型定义,ERi(t)表示水质参数i在时刻t的估计残差;
(2.2)误差分类:将计算残差ERi(t)作为数据值分类为“正常”、“异常”的标准;利用训练得到的阈值进行误差分类,如果测量值在阈值范围内,表明没有异常事件发生,属于正常状况;在训练阶段,通过查看多次实验后的每个水质参数残差值,可以发现落在[96%,99%]这个上限和下限范围内的残差是可以接受的残差;若残差超过此范围,判定为异常值。
4.根据权利要求1所述的多变量水质参数时序数据异常事件检测方法,其特征在于,所述内容(3)确定单变量参数异常事件:基于误差结果的分类,通过序贯更新贝叶斯更新确定单变量水质参数的事件概率;确定单变量参数异常事件的具体步骤如下:
(3.1)通过序贯贝叶斯分析,将检测到的异常点转换为污染异常事件的概率;在序贯分析中,观察值的数量事先不知;相反,观察值顺序读取,需要对当前的状态做出决策;
(3.2)每次经过序贯更新后,进行三种判断:有事件、无事件、额外观察;序贯更新后有两种状态:离群点,正常值;初始情况下,污染事件的概率很低,对于每次新到的观测值,事件的后验概率通过贝叶斯规则序贯更新,更新公式如下;
其中P(Et)表示一个事件在时刻t的概率,Ot和表示观察值在时刻t的“异常点”和“正常值”,序贯贝叶斯规则依赖于训练阶段得到的理想的检出率和误报率,检出率简称RD,误报率简称FRA;P(Et|Ot)表示在时刻t传感器节点的残差被归类为离群点,更新的异常事件概率;表示在时刻t传感器节点的残差被归类为正常值,更新的异常事件概率;
检出率和误报率是异常事件检测算法的性能评价经常使用的标准,RD表示检测出异常的数目占实际发生的异常总次数的比值;FRA表示检测出的虚假异常占所有决策次数的比值;
(3.3)判断单变量参数异常事件:污染事件的初始概率设为10-5,污染事件发生的阈值概率设为PThreshold=0.7;在这个阶段,对每一个水质参数而言,每个参数的概率各自更新;如果某个参数污染事件更新的概率超过该参数设定的阈值PThreshold,表明该参数发生污染异常事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710007484.6/1.html,转载请声明来源钻瓜专利网。