[发明专利]基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法有效
申请号: | 201711268459.X | 申请日: | 2017-12-05 |
公开(公告)号: | CN108228716B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 许玉格;赖春伶;罗飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06Q50/06 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 冯炳辉 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基分类器 故障诊断 污水处理 极限学习机 加权 污水处理过程 分类准确率 集成分类器 训练样本集 隐层节点数 不平衡性 最优参数 污水 归一化 过采样 均值法 有效地 算法 样本 多样性 输出 改进 | ||
本发明公开了一种基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法,包括步骤:1)用均值法补全污水数据中属性不完整的样本的缺陷项,将其归一化到[0,1]区间中;2)设置基分类器个数及其隐层节点数的最优参数;3)针对每个基分类器采用改进的SMOTE算法对其对应的训练样本集进行独立过采样,训练基分类器;4)用基于G‑mean的方法确定每个基分类器的输出权值;5)对所有基分类器训练结束后将其进行集成,得到最终的集成分类器。本发明在有效地降低了污水数据的不平衡性的同时提高了基分类器间的多样性,提高了对污水处理故障类的分类准确率,进而有效提高了污水处理过程中故障诊断的整体性能。
技术领域
本发明涉及污水处理故障诊断领域,尤其是指一种基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法。
背景技术
污水处理是一个复杂的,多变量的生化过程。污水处理厂发生故障容易引发一系列严重的污水污染问题。而污水处理过程的故障诊断是一个模式识别的分类问题。污水数据集由定期将污水厂采集到的数据及其当前工作状态组成。由于合格的污水处理厂发生故障的频率很低,污水数据集中故障状态下的数据远少于正常状态下的数据。这就导致污水数据集是分布高度不平衡集,即污水处理过程的故障诊断是一个数据不平衡的分类问题。
由于传统学习算法往往基于总体准确率对参数进行优化,因此容易使分类结果更偏向多数类。但在现实应用场合更被看重的是少数类的分类准确率,即在污水处理故障诊断场合,更重要的是准确分类出作为少数类的故障类。及时诊断污水处理厂的运行故障并对故障及时进行处理可减少运行费用、稳定出水水质并减少污水对环境的污染。
发明内容
本发明的目的是为了解决现有学习算法里对污水故障识别效果不佳的缺陷,提出了一种基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法,在有效地降低了污水数据的不平衡性的同时提高了基分类器间的多样性,提高了对污水处理故障类的分类准确率,进而有效提高了污水处理过程中故障诊断的整体性能。
为实现上述目的,本发明所提供的技术方案为:基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法,包括以下步骤:
1)用均值法补全污水数据中属性不完整的样本的缺陷值,并将其归一化到[0,1]区间;
2)为了增加过采样数据的多样性,提出新的SMOTE过采样方法,对初始训练数据进行SMOTE过采样处理,获得新的训练数据,用该采样步骤替代原始Bagging算法中有放回Booststrap步骤;然后采用加权极限学习机作为基分类器,建立第i个基分类器hi(x),hi(x)表示第i个基分类器;最后,定义新的基于不平衡分类性能指标G-mean值的基分类器输出权值计算公式,并计算该基分类器的输出权值αi;其包括以下步骤:
2.1)给定含N个污水样本集X={(x1,y1),(x2,y2),...,(xN,yN)},样本共有K个类别,其中xi表示X的第i个样本,yi为K维列向量,表示其对应的类别标签,若xi属第K类,则yi的第K个元素标为1,其余元素标为-1,第1类样本的类别标签写为{1,-1,...,-1};
2.2)将X中样本数小于N×0.2的类别视为少数类,对少数类每类分别采用改进的SMOTE方法进行过采样,过采样后用得到的新样本结合原始数据组成新的训练集Xnew,以Xnew来训练一个加权极限学习机hi(x);其中,改进的SMOTE过采样方法具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711268459.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示图像的方法、终端及计算机可读存储介质
- 下一篇:页面的加载方法及装置