[发明专利]流域水质预测方法和装置、计算机可读存储介质在审
申请号: | 202011321750.0 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112684130A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 李震;孙锋;黄红杉 | 申请(专利权)人: | 深圳市水务科技有限公司 |
主分类号: | G01N33/18 | 分类号: | G01N33/18;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄广龙 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流域 水质 预测 方法 装置 计算机 可读 存储 介质 | ||
本公开实施例提供流域水质预测方法和装置、计算机可读存储介质,属于水质预测领域。流域水质预测方法,包括:获取流域的样本数据集;对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;将所述中间样本数据输入至预设的目标预测模型;通过所述目标预测模型对所述中间样本数据进行预测,得到目标水质数据,本公开实施例只需要构建目标预测模型,不需要构建多个模型,降低了构建模型的成本,并提高了预测水质数据的准确性。
技术领域
本发明涉及计算机领域,尤其涉及流域水质预测方法和装置、计算机可读存储介质。
背景技术
流域水质预测方法通常使用机器学习算法,例如KNN、线性回归、逻辑回归、支持向量机等,能满足部分需求。但机器学习算法受限于其输入数据类型的要求,只能是数值类型,在这样的前提下,对流域水质影响权重较大的文本型数据不能进行处理;另外,流域环境复杂,很难找到一种算法较能好地拟合流域水质预测的需求,通用的方法利用常见的机器学习算法建立多个模型,比较麻烦和复杂。
发明内容
本公开实施例的主要目的在于提出一种流域水质预测方法和装置、计算机可读存储介质,以降低构建预测模型的成本、提高预测水质数据的准确性。
为实现上述目的,本公开实施例的第一方面提出了一种流域水质预测方法,包括:
获取流域的样本数据集;
对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;
将所述中间样本数据输入至预设的目标预测模型;
接收所述预测模型根据所述中间样本数据预测出的目标水质数据。
在一些实施例中,所述流域的样本数据集包括文本数据,所述对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据,包括:
获取所述文本数据;
获取历史数据;
根据所述文本数据对所述历史数据进行独热码编码预处理,得到所述中间样本数据。
在一些实施例中,所述文本数据包括天气数据。
在一些实施例中,对所述流域的样本数据集进行清洗处理,得到清洗后的流域中间数据;其中,将所述清洗后的流域中间数据作为进行所述独热码预处理的数据。
在一些实施例中,所述流域中间数据至少包括以下数据之一:空值数据、重复数据、异常范围数据、通过天气接口获取到的外部数据,所述对所述流域中间数据进行清洗处理,得到清洗后的流域中间数据,至少包括以下步骤之一:
对所述空值数据进行清洗处理,得到所述清洗后的流域中间数据;
对所述重复数据进行清洗处理,得到所述清洗后的流域中间数据;
对所述异常范围数据进行清洗处理,得到所述清洗后的流域中间数据;
对所述外部数据进行清洗处理,得到所述清洗后的流域中间数据。
在一些实施例中,所述中间样本数据包括样本水质数据,所述方法还包括:构建所述目标预测模型,具体包括:
根据所述样本水质数据构建初始预测模型;
将所述样本水质数据输入至所述初始预测模型进行训练,得到所述目标预测模型。
在一些实施例中,所述中间样本数据还包括测试水质数据,所述方法还包括:根据所述测试水质数据对所述目标预测模型进行评估。
在一些实施例中,所述方法还包括:
将所述目标预测模型部署至应用平台,所述应用平台至少为以下之一:应用数据库或者应用管理平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市水务科技有限公司,未经深圳市水务科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011321750.0/2.html,转载请声明来源钻瓜专利网。