[发明专利]一种基于多元回归和随机森林的水质监测指标预测方法在审
| 申请号: | 202111323326.4 | 申请日: | 2021-11-09 |
| 公开(公告)号: | CN116108941A | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 李旭杰;史灵;李浩天;穆营利;徐缘;汤静;刘春燕 | 申请(专利权)人: | 河海大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/0639;G06Q10/067;G06Q50/06;G06F16/215;G06F18/214;G06F18/27;G06N5/01 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 210098 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多元 回归 随机 森林 水质 监测 指标 预测 方法 | ||
本发明公开了一种基于多元回归和随机森林的水质监测指标预测方法。该发明首先基于水质监测的各类监测指标,利用Pearson相关系数对监测指标间的相关程度进行分析,从而得到各监测指标间的相关系数,进一步通过多元线性回归算法得到高度相关的参数指标间的统计关系,利用回归方程的形式表示监测变量间的因果关系,最后通过随机森林算法利用水质监测中的自变量指标实现对因变量指标的预测,达到减少监测项目从而降低监测成本的目的。本发明能有效提高水质监测的效率以及降低监测指标项目成本,且具有预测准确度高、泛化能力强的特点。
技术领域
本发明涉及大数据和机器学习领域,特别涉及一种基于多元回归和随机森林的水质监测指标预测方法。
背景技术
水质监测作为维护水环境健康的重要手段,对人民生活的需求以及国家生态文明建设等方面起到至关重要的作用。作为现代化社会中不可或缺的水环境有效保护手段之一,水质监测的应用越发广泛,朝着信息化、自动化的方向发展成为必然趋势。由于水质监测指标种类繁多,水质监测数据量大,故水质监测指标的数据具有很高的利用价值。从大量的水质监测指标数据中提取有价值的信息,找寻数据之间的本质关系,基于相关联的信息进行预测,能够有效提高水质监测的信息利用率,降低监测成本。
近年来我国水质监测发展迅速,对水质状况进行监测时往往监测的指标种类众多,监测成本较高,且信息量巨大难以从中提取有效信息,对数据进行有效分析势在必行。为有效降低监测成本对监测指标项目进行合理降维,利用Pearson相关系数对指标间进行相关性分析的优点是能够对变量关系间的强弱进行有效度量,但并未对变量之间的关系进行固化形成模型,无法利用这种关系对数据进行预测,需要进一步进行回归分析,在实际应用中一个参数指标往往受到多个参数指标的影响,多元线性回归模型相较于其他回归模型更易于实施,实用意义更大。
在水质监测对各类指标进行监测的实际应用中,利用多元线性回归得到高度相关的监测指标间统计方程,可以准确得知指标影响间的自变量指标和因变量指标,对因变量指标进行有效预测可减低监测成本。利用随机森林算法中的回归模型对监测指标进行预测,对于其他回归模型而言,随机森林回归模型具有预测准确度高、泛化能力强的优势。目前随机森林算法现已应用于水利领域进行预测水质类别,但未在水质监测指标预测得到应用,因此随机森林回归模型在水质监测指标的分析预测的应用研究具有重要意义。
发明内容
发明目的:本发明的目的是针对水质监测中监测指标繁多,数据量大,监测成本高,难以从中快速获取有效信息的情况进行研究,设计了一种基于多元回归和随机森林的水质监测指标预测方法,使得水质监测指标得到降维,利用指标间的相关性和回归模型使得较少的指标来表示更多的指标同时能够进行指标的预测,降低监测成本,提高信息利用率。
技术方案:为实现上述发明目的,本发明采用如下技术方案:
一种基于多元回归和随机森林的水质监测指标预测方法,包括如下步骤:
(1)获取水质监测项目监测过程中所用的各类监测指标数据;
(2)对水质监测的各类监测指标数据进行清洗,剔除无效、异常数据;
(3)利用Pearson相关系数对清洗后的水质监测指标数据进行各类监测指标变量间的相关程度分析,得到各个水质监测指标间的相关系数,对影响水质的主导因素进行识别;
Pearson相关系数的公式表达为:
式中,n为样本量,xi和yi分别为两监测指标的变量值,和分别为xi和yi样本的平均值;
(4)采用显著性检验的方法对Pearson相关系数进行检验,验证各监测指标间的相关性非偶然因素引起,所得结果能够代表总体指标数据上的相关程度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111323326.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种设有旋转椅的直升机
- 下一篇:割草机
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





