[发明专利]一种基于随机森林回归的汽油辛烷值损失预测及优化方法在审
申请号: | 202110585037.5 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113362913A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 陈德裕;许江华;林芳;李明 | 申请(专利权)人: | 南通大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C10/00;G06N3/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 回归 汽油 辛烷值 损失 预测 优化 方法 | ||
本发明提供了一种基于随机森林回归的汽油辛烷值损失预测及优化方法,包括以下步骤:对数据进行预处理、对操作变量进行筛选、对非操作变量进行因子分析进行降维、建立辛烷值损失预测模型,选用随机森林回归,结合K折交叉验证方法与均方误差评价指标和改进模拟退火算法对主要变量进行优化,根据Metropolis准则接受微调后的变量结果,对辛烷值损失进行预测及优化。本发明的有益效果为:通过考虑非操作变量、操作变量和汽油辛烷值的关系,对体系关系的建立更精确更全面,相较于马达法辛烷值、道路法辛烷值等方法,该方法进行对非操作变量和操作变量分别降维后综合考虑,不仅能够简化模型,还改善模型的通用性。
技术领域
本发明涉及化学工业、机器学习技术领域,尤其涉及一种基于随机森林回归的汽油辛烷值损失预测及优化方法。
背景技术
汽油是小型车辆的主要燃料,汽油燃烧产生的尾气排放对大气环境有重要影响。为此,世界各国都制定了日益严格的汽油质量标准。汽油清洁化重点是降低汽油中的硫、烯烃含量,同时尽量保持其辛烷值。目前,国内炼油工艺设备和工艺不统一,原料组成复杂,不可控因素多,难以实现连续扩容和优化生产的目标。因此,在目前严格的国家标准下,如何降低汽油中的硫、烯烃等物质,使化工厂得到辛烷值尽可能高的汽油,成为汽油生产领域的重点和难点。
随着汽车发动机压缩比的提高,对汽油辛烷值的要求越来越高。通过仪器测量辛烷值,需要花费大量的时间和研究经费,因此,通过各种数学模型和算法建立辛烷值预测模型具有重要意义。机器学习是人工智能及模式识别领域的共同研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。2010年的图灵奖获得者为哈佛大学的Leslie vlliant教授,其获奖工作之一是建立了概率近似正确(Probably ApproximateCorrect,PAC)学习理论;2011年的图灵奖获得者为加州大学洛杉矶分校的Judea Pearll教授,其主要贡献为建立了以概率统计为理论基础的人工智能方法。这些研究成果都促进了机器学习的发展和繁荣。传统机器学习的研究方向主要包括决策树、随机森林、人工神经网络、贝叶斯学习等方面的研究。随机森林(RF)作为机器学习重要算法之一,是一种利用多个树分类器进行分类和预测的方法。近年来,随机森林算法研究的发展十分迅速,已经在生物信息学、生态学、医学、遗传学、遥感地理学等多领域开展的应用性研究。
发明内容
本发明的目的在于提供一种基于随机森林回归的汽油辛烷值损失预测及优化方法。本发明是通过如下措施实现的:一种基于随机森林回归的汽油辛烷值损失预测及优化方法,其中,包括以下步骤:
1、对影响汽油辛烷值的操作变量和非操作变量数据进行预处理:
(1)统计各操作变量的数据缺失情况,将数据缺失达到20%以上的变量进行删除;
(2)对于变量中部分缺失的数据,用前后两个时间点的数据的平均值代替;
(3)根据3σ准则删去变量中的异常值,再用前后两个时间点的数据的平均值代替;
我们采用3σ准则找出变量中的异常值。若某一变量下测量值xi的剩余误差的绝对值|vi|大于3 乘以该变量下所有测量值的标准误差σ,则认为该测量值是异常的。即,
其中,表示该变量下所有测量值的算术平均值,σ表示所有测量值的标准误差
2、操作变量的筛选:
(1)Spearman秩相关系数筛选
Spearman秩相关系数的定义为,
当样本有相同的秩,我们称之为有结。这时,我们需要采用平均秩法赋秩,并将Spearman 秩相关系数调整为,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110585037.5/2.html,转载请声明来源钻瓜专利网。