[发明专利]一种基于随机森林算法的离子浓度预测方法在审
申请号: | 201811257092.6 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109524062A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 刘军;张苏沛 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/70 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;杨彩兰 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离子 随机森林 算法 浓度预测 初始样本集 预测 强学习机 样本采集 样本组成 学习机 训练集 离子浓度数据 弱学习机序列 标准化处理 弱学习算法 测试样本 预测模型 测试集 决策树 迭代 拟合 抽取 样本 | ||
一种基于随机森林算法的离子浓度预测方法,所述方法包括如下步骤:样本采集得到离子浓度数据以及与离子浓度相关的数据;对样本采集得到的所有数据进行标准化处理得到初始样本集;从初始样本集有放回地抽取一部分初始样本组成一组训练集,剩下的样本组成一组测试集;选定CART决策树作为随机森林算法中的弱学习算法对训练集训练得到弱学习机,共进行K次迭代,从而得到弱学习机序列,序列中包含各弱学习机h1,h2....hk,该序列即为强学习机H;利用强学习机H对待测样本进行预测,对预测值取平均值得到测试样本的预测值。根据本发明提供的基于随机森林算法的离子浓度预测方法,用于预测离子浓度,具有极佳的拟合效果,该预测模型描述离子浓度具有较好的精确度。
技术领域
本发明属于离子浓度预测领域,具体涉及一种基于随机森林算法的离子浓度预测方法。
背景技术
目前,为缓解供需矛盾,自2002年开始,国家投资开发公司开始在罗布泊开发钾盐,目前新疆罗布泊已成为中国重要的钾肥生产基地,并且已经形成从单一钾肥开发到盐湖化工、能源化工等多种产业模式。
盐场主要通过太阳能分级蒸发卤水来获取其中的离子资源,包括Na+, K+,Mg2+等。其中氯化钠可以用于制作碱化工产品,含钾光卤石用于生产钾肥,水氯镁石是镁工业的主要原料。在提取过程中,根据离子浓度的不同,采集和去除杂质的方法也有所不同,因此通过预测盐田某位置离子的浓度,可以有效提高采集效率,降低成本,节约能源。随机森林作为一种常用的集成建模方法,以以决策树为基学习器,通过将若干个建立好的模型所得到的结果进行综合得到一个模型,而最后的预测结构由所有模型的预测结果平均而得。随机森林的最大优势是每个决策树均利用所有样本中的一部分,并只抽取其中一部分属性进行建模。这种做法能极大的提高模型的多样性,最小化了各棵决策树的相关性。依照集成学习理论来说,基学习器的多样性越强,其泛化能力就越高。
发明内容
本发明解决的技术问题为:提供一种基于随机森林的离子浓度回归预测方法,用以预测离子浓度,具有极佳的拟合效果,预测模型描述离子浓度具有较好的精确度。
本发明提供的具体解决方案包括如下步骤:
1)样本采集得到离子浓度数据以及与离子浓度相关的数据;
2)对样本采集得到的所有数据进行标准化处理得到初始样本集;
3)从初始样本集有放回地抽取一部分初始样本组成一组训练集,剩下的样本组成一组测试集;
4)选定CART决策树作为随机森林算法中的弱学习算法,在建立CART 决策树的过程中,每次随机选择部分特征,在特征属性中选择最佳划分属性,完成训练集样本的训练得到弱学习机。
5)重复步骤3)、4),得到预测函数序列h,将该预测函数序列h对测试集样本进行预测,计算测试集预测误差,当测试集预测误差小于设定值,终止迭代过程,共进行K次迭代,从而得到弱学习机序列,序列中包含各弱学习机h1,h2....hk,该序列即为强学习机H;
6)将强学习机H作为离子预测模型,将待测样本的离子属性数据输入到强学习机H,强学习机H利用其各个弱学习机h1,h2....hk分别对待测样本进行预测,对预测函数序列的预测值取平均值得到待测样本的预测值。
由此,通过对样本进行有放回的随机抽样,最终生成多个独立的模型,不同模型之间不存在依赖关系,综合不同模型的预测结果,对回归问题取平均值,预测模型预测离子浓度具有较好的精确度。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步,所述步骤1)中样本采集的内容包括离子种类、采集时间、采集地点的纵横坐标、盐池编号以及相应的离子浓度等,其中离子种类、采集时间、采集地点的纵横坐标和盐池编号等作为特征属性,离子浓度为预测目标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811257092.6/2.html,转载请声明来源钻瓜专利网。