[发明专利]一种基于XGBoost城市污水排放异常识别分类模型在审
申请号: | 202310685064.9 | 申请日: | 2023-06-12 |
公开(公告)号: | CN116595462A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 台亚洁;马守龙;刘杰鹏;黄俊 | 申请(专利权)人: | 合肥学院 |
主分类号: | G06F18/243 | 分类号: | G06F18/243;G06N3/088;G06F18/23213 |
代理公司: | 丽水创智果专利代理事务所(普通合伙) 33278 | 代理人: | 邱志文 |
地址: | 230000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 xgboost 城市 污水 排放 异常 识别 分类 模型 | ||
1.一种基于XGBoost城市污水排放异常识别分类模型,其特征在于,包括以下步骤:
S1:将在线校准管网流量动态监测系统提供的监测点位平面展示,通过拓扑分析各监测点之间存在的依赖关系;
S2:对历史流量数据进行预处理,形成适用于XGBoost分类算法模型的排水流量数据样本;
S3:XGBoost分类识别模型训练数据集准备,通过采集16个监测点排水管网历史数据,经处理形成适用于无监督算法初始数据集;
S4:初始数据集无监督算法学习之后,分析确定出四个类别数据分别为正常、雨污混接、偷排漏排、入流入渗,形成分类识别模型训练数据集;
S5:采用k折交叉验证方法结合网格搜索最优超参数,设定最合适的模型参数,进一步提升初始XGBoost模型的准确度;
S6:对提供的数据进行四类成因判断。
2.根据权利要求1所述的基于XGBoost城市污水排放异常识别分类模型,其特征在于,S1步骤中在线校准管网流量动态监测系统提供所在区域内排水管网地理空间分布信息,监测点部署信息和周边设施信息,将收集的信息进行可视化处理,利用CAD软件将水管网的分布可视化,以便了解水流方向,检测器位置,用拓扑排序分析水管网结构,寻找监测点之间的依赖关系。
3.根据权利要求1所述的基于XGBoost城市污水排放异常识别分类模型,其特征在于,S2步骤中对获取的数据进行解压,采用xlsx格式保存,共有如下特征Flow_rate(L/s)(max)、Flow_rate(L/s)(min)、Flow_rate(L/s)(avg)、Flow_rate(L/s)(sd)、Flow_rate(m/s)(max)、Flow_rate(m/s)(min)、Flow_rate(m/s)(avg)、Flow_rate(m/s)(sd)、Liquid_level(m)(max)、Liquid_level(m)(min)、Liquid_level(m)(avg)、Liquid_level(m)(sd)、Water_emperature(℃)(max)、Water_emperature(℃)(min)、Water_emperature(℃)(avg)、Water_emperature(℃)(ad)、Yellow_Sea_level、weather;经过数据清洗、数据集成、数据变换、数据归约四个步骤,解决数据存在的质量问题,使数据达到模型建立的处理要求;根据特征分析各数据之间存在的关系;通过特征重要性排序,选择前12个最重要特征,通过特征选择确定XGBoost初始训练数据。
4.根据权利要求1所述的基于XGBoost城市污水排放异常识别分类模型,其特征在于,S3步骤中采集16个监测点排水管网历史数据作为初始模型训练数据;无监督学习,获取训练样本的真实标签,对训练样本进行归一化处理;将归一化后的数据按照特征重要性排序选取特征并进行MiniBatchK-Means无监督算法分类,对已分类数据进行聚类分析,找出数据种的类别标签,即为四类:正常、雨污混接、偷排漏排、入流入渗,将标签返回至训练数据集,训练数据每条都有对应的流量监测类型标签;XGBoost分类识别模型训练数据划分为80%训练集,20%验证集;利用训练集对XGBoost机器学习模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥学院,未经合肥学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310685064.9/1.html,转载请声明来源钻瓜专利网。