[发明专利]基于核函数的加权极限学习机污水处理在线故障诊断方法有效
申请号: | 201610061351.2 | 申请日: | 2016-01-28 |
公开(公告)号: | CN105740619B | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 许玉格;邓文凯;邓晓燕;罗飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于核函数的加权极限学习机污水处理在线故障诊断方法,包括步骤:1)剔除掉污水数据中属性不完整的数据,然后将数据归一化处理,确定历史数据集和更新测试集;2)选取核函数和加权方案,然后根据最优模型确定模型参数;3)根据所选取的加权方案对历史数据集的每个样本赋予权值;4)训练模型,根据核函数计算核矩阵;5)从更新测试集中添加新样本到模型中进行测试,并更新历史数据集;6)回到步骤3),重新训练模型,不断重复上述过程,直到在线测试数据完毕,从而实现对污水处理过程的在线运行状态的识别。本发明方法更新时间短,分类准确率高,对于实时诊断出运行故障,污水处理厂安全运行,提高污水处理厂的运行效率具有重要意义。 | ||
搜索关键词: | 核函数 加权 历史数据 在线故障诊断 极限学习机 污水处理厂 更新测试 训练模型 污水处理 污水处理过程 在线运行状态 分类准确率 数据归一化 安全运行 方法更新 模型参数 实时诊断 运行故障 运行效率 在线测试 重要意义 最优模型 核矩阵 新样本 剔除 样本 测试 污水 重复 更新 赋予 | ||
【主权项】:
基于核函数的加权极限学习机污水处理在线故障诊断方法,其特征在于,包括以下步骤:1)剔除掉污水数据中属性不完整的数据,然后将数据归一化处理,确定历史数据集xold和更新测试集xnew;2)选取核函数和加权方案,根据最优模型确定模型参数;3)根据所选取的加权方案对历史数据集xold的每个样本赋予权值,求出加权矩阵W;4)训练模型,根据核函数计算核矩阵ΩELM;5)从更新测试集xnew中添加k个新样本到模型中进行测试,并保存分类测试结果,将其添加到历史数据集中,去掉历史数据集中前k个样本;6)回到步骤3),更新W和ΩELM,重新训练模型,不断重复上述过程,直到在线更新数据测试完毕,得到最终在线测试结果,从而实现对污水处理过程的在线运行状态的识别;在步骤2)中,对加权方案和核函数的选取以及最优模型参数的确定如下:首先对于加权方案的选取,这里有两种加权方案,第一种加权方案为:
其中,W1为第一种加权方案的加权矩阵,Count(ti)为训练样本中类别为ti对应的样本数量;另一种加权方案为:
W2为第二种加权方案的加权矩阵;对于核函数的选取,有下面四种常用的核函数:①径向基RBF核函数:
②线性核函数:K(x,x′)=x·x′ (4)③p阶多项式核函数:K(x,x′)=[(x·x′)+1]p,p=1,2,3... (5)④Sigmoid核函数:K(x,x′)=tanh[a(x·x′)+b] (6)考虑到p阶多项式核函数的参数为两个,要比RBF核函数更多,且当多项式的阶数比较高时,核矩阵的元素值将趋于无穷大或无穷小,会增加数值的计算困难;而Sigmoid核函数必须在某些特定条件下才满足对称、半正定的核函数条件,并且有两个参数要选取,其应用上受到一定的限制;所以,首先选取径向基核函数RBF,然后分别选取不同的加权方案进行离线测试并记录测试结果,然后选取第一种加权方案,分别选取径向基RBF核函数和线性核函数进行离线测试并记录测试结果,以测试分类准确率、各类准确率、所有类准确率的几何平均值以及训练时间作为性能指标,分析不同加权方案和核函数的选取对模型性能的影响,最终确定模型的加权方案和核函数:第一种加权方案W1和RBF核函数;关于最优模型参数的确定,对模型的参数正规化系数C和RBF核函数参数σ采用网格搜索法,选取在线故障诊断最优测试结果所对应的参数为最优参数;在步骤3)中,根据所选取的加权方案对历史数据集xold的每个样本赋予权值,求出加权矩阵W的过程如下:根据步骤2)所确定的加权方案W1,采用公式(1)来计算每个污水训练样本的权值,最终可以用以下方式求得加权矩阵W:对于N个污水训练样本,T表示训练样本的类别,Count(classX)表示训练样本中类别X的样本个数,对每个样本根据其类别计算出该类别的总的样本个数,也就是Count(class X)),从而可以求得该样本的权值Wii=1/Count(classX);在步骤4)中训练模型,根据核函数计算核矩阵ΩELM如下:给定N个污水数据集的训练样本{xi,ti},i=1,...,N,xi∈Rd,N为样本个数,d为样本属性维数,含有L个节点的标准极限学习机SLFN的数学模型表示如下:
其中,βi表示第i个隐藏神经元与所连接输出神经元的输出权值,G为隐藏层神经元激活函数,wi表示输入层与第i个隐藏神经元的输入权值,bi表示第i个隐藏神经元的偏置,oj为第j个输出神经元的实际输出值,x为神经网络输入,tj为神经网络输入目标值;对于数量为N的样本{xi,ti},i=1,...,N,存在一个(wi,bi)和βi,有
使得该SLFN的模型零误差逼近样本集{xi,ti},i=1,...,N,也就是说隐藏层前向神经网络能够无误差的对其进行拟合,即:
将上式表示为:Hβ=T (9)其中![]()
其中,H为输出矩阵,β为输出权值矩阵,T为输出层输出矩阵;当激活函数G无限可微时,SLFN参数不需要全部进行调整,输入链接权重wi和隐藏层偏置bi在网络参数初始化的过程中随机选定,并且在训练过程中保持不变,那么训练SLFN就等价于求解线性系统Hβ=T的最小二乘解,从而获取β的值,也就可以转化为下面的优化问题:Minimize:||Hβ‑T||2和||β|| (11)该优化问题以数学的形式表示为:Minimize:
Subject to:
其中,ξi=[ξi,1,...,ξi,m]T是训练样本xi在第m个输出节点的输出值与真实值之间的误差向量;由隐藏层神经元输出的Moore‑Penrose广义逆矩阵H+可解得:β=H+T (13)正交投影法KKT能够有效地对Moore‑Penrose广义逆矩阵进行求取;当HTH或HHT为非奇异矩阵的情况时H+=(HTH)‑1HT或H+=HT(HTH)‑1;为了使所得到的模型获得更好的稳定性和泛化性能,在求解β时对HTH或HHT对角线元素加上一个足够小的正值1/C:
相应的输出函数为:
或者当:
相应的ELM的最终的输出函数为:
在这种ELM算法的实现方式中,隐藏层神经元数量的选择区间可以很大,并且可以不根据训练样本数量N进行确定,即能够使L≤N,也能够使L≥N;在这一点上,这种方式与插值理论中所要求的L≤N所矛盾,但仍与广义逼近理论一致;同理,加权极限学习机WELM使用相对于奇异值分解法SVD更稳定的正交投影解法求解β,然后通过对个样本进行加权,使得属于不同类的样本获得不同的权值,进而得到更好的分类准确率,所以上述的优化问题的数学形式改写成:Minimize:
Subject to:
其中,W是定义的一个N×N的对角矩阵,每一个主对角元素Wii都对应着一个样本xi,不同类别的样本将会自动分配不同的权值;根据KKT最优化条件,定义Lagrange函数求解该二次规划问题,则等效为求解下面的公式:Minimize:![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610061351.2/,转载请声明来源钻瓜专利网。
- 上一篇:矿山采空区充填设备
- 下一篇:一种确定系统云化故障概率分布变化趋势的方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用