[发明专利]一种Fast RVM污水处理故障诊断方法有效
申请号: | 201610009907.3 | 申请日: | 2016-01-04 |
公开(公告)号: | CN105487526B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 许玉格;邓文凯;陈立定 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G05B23/02 | 分类号: | G05B23/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障诊断 向量机 多分类模型 数据扩充 采样 聚类 污水 样本 污水处理 虚拟 污水生化处理过程 污水生化处理系统 数据压缩模块 归一化处理 不平衡性 数据压缩 样本属性 归一化 建模 量纲 一对一 剔除 | ||
1.一种Fast RVM污水处理故障诊断方法,其特征在于,包含以下顺序的步骤:
S1.剔除污水输入和输出的数据中的异常点,对其进行归一化处理,归一化到[0,1]区间中;
S2.基于聚类的快速相关向量机多数类数据压缩模块,将训练样本中的多数类样本数据采用K-means方法进行聚类;具体过程如下:
S201、假设多数类样本集X={x1,x2,…,xa,…,xn}为n个Rd空间的数据,从n个数据对象中随机选择k个对象作为初始的聚类中心;
S202、然后对剩余的样本对象则根据与各个聚类中心的距离分别分配到距离最相近的聚类中心中;计算距离的公式如下,假设cj为第j个类的中心,则xa与cj的距离为:
S203、根据集合中的点更新每个类的聚类中心,假设第j个类中的样本为即包含了nj个样本,则该类的聚类中心为其中为类中心cj的第b个属性,计算公式如下:
S204、不断重复S202、S203步骤,直到标准测度函数收敛为止,采用均方差作为计算标准测度函数,其形式为:
将多数类样本聚类后,对聚类后的样本类别进行快速相关向量机分类建模,从而通过建模获取相关向量;
S3.虚拟少数类向上采样的少数类数据扩充模块将训练样本中的少数类样本数据采用SMOTE进行数据扩充;
S4.将处理后的所有类的样本数据重新组合构成新的训练集,建立“一对一”的快速相关向量机多分类模型,对建好的分类模型输入测试集进行投票,得到测试结果,从而实现对污水处理的整体运行状态的识别。
2.根据权利要求1所述的Fast RVM污水处理故障诊断方法,其特征在于,所述的步骤S3,具体为:
S301、对少数类中的每一个样本x,以欧几里得距离为标准计算它到少数类样本集中每个样本的距离,获得其中k个最近邻,并记录近邻样本的下标,这里k取5;
S302、根据向上采样的倍率C,对每一个少数类样本x,从其k个最近邻中随机选取C个样本,记为y1,y2,…,yC;
S303、在原样本x与yj之间进行随机线性插值,构造新的少数类样本pj,即新样本:
pj=x+rand(0,1)*(yj-x),j=1,2,…,C (4)
其中rand(0,1)表示区间(0,1)内的一个随机数。
3.根据权利要求1所述的Fast RVM污水处理故障诊断方法,其特征在于,步骤S4中,所述“一对一”的快速相关向量机多分类模型,其建立过程如下:
相关向量机是通过最大化边际似然函数p(t|α,σ2)的方法确定超参数α和方差σ2的,等价于最大化为其对数;记L(α)=log[p(t|α,σ2)],整理有:
其中C=σ2I+ΦA-1ΦT,t=[t1,t2,...,tN]T;
对矩阵C进行等价变换,如下:
其中此矩阵表示当αi=∞时,相应的基向量φi被移除后样本对应的协方差矩阵,根据矩阵相关性质整理可得
因此公式(5)可以改写为
其中L(α-i)表示为当αi=∞时,相应的基本向量φi被移除后所对应的边界似然函数的对数,而l(αi)表示边界似然的对数函数中只与αi有关的独立部分;
公式(8)对αi求偏导有
记
所以公式(9)可改写为
令公式(11)等于零,考虑到αi是方差值必须为正,所以当时有
对L(α)关于αi求二阶偏导有
综合公式(11)和(12)进行分析可知
所以当时,公式(14)左边的表达式是恒小于零的,并对以上推导公式分析可得,L(α)有唯一最大值点为
根据上面的分析,通过以下方法最大化贝叶斯L(α):
A、当基向量φi在模型中,即αi<∞,但有则将φi从模型中删除,即令αi=∞;
B、当基向量φi在模型中,即αi=∞,但有则将φi添加到模型中并利用公式(15)更新αi;
C、当基向量φi在模型中,即αi<∞,但有则用公式(15)更新αi;
综上所述,快速相关向量机分类基本算法步骤如下:
(1)初始化σ2=0;
(2)用单个基向量φi初始化αi,由公式(15)分析整理可得并设置其他的αm为无穷大,m≠i;
(3)计算Σ、μ并对所有M个基函数φm初始化Si和Qi;
(4)从所有M个基函数φm集合中选择候选的基向量φi;
(5)计算
(6)若θi>0且αi<∞,重新估计αi;
(7)若θi>0且αi=∞,添加φi到模型中并重新估计αi;
(8)若θi≤0且αi<∞,删除φi并设置αi=∞;
(9)用Laplace逼近方法重新计算协方差矩阵Σ,权重矩阵μ以及相应迭代过程中的Si和Qi;
(10)若收敛或者达到最大迭代次数,则终止程序;否则转步骤(4);终止条件为:任意在模型中的基函数对应的αi,有αi<1*10^12且
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610009907.3/1.html,转载请声明来源钻瓜专利网。