[发明专利]基于Stacking集成学习的气象水文特征预测方法及系统在审
申请号: | 202111582505.X | 申请日: | 2021-12-22 |
公开(公告)号: | CN114254767A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 张华军;占宇;苏义鑫;张丹红 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06N20/20 | 分类号: | G06N20/20;G06K9/62 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 姜婷 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 stacking 集成 学习 气象 水文 特征 预测 方法 系统 | ||
1.一种基于Stacking集成学习的气象水文特征预测方法,其特征在于,包括如下步骤:
S1、获取海上气象水文特征原始数据集,将原始数据集中的数据划分为训练集和预测集;
S2、对原始数据集中的数据特征进行相关性分析和数据集预处理;
S3、选取既定个与目标特征相关系数较大的特征并进行归一化处理,将原始特征数据线性化转换到[0,1]范围内;
S4、运用PCA主成分分析法对所选特征向量进行降维去噪,降维至预定维数生成新的特征向量;
S5、搭建第一层机器学习器模型,该第一层机器学习器模型包括四个并列且不同的基学习器:SVR、随机森林、Lasso回归、ElasticNet回归;
S6、第一层采用5折交叉验证训练,将训练集分成5等份样本,依次将其中1份样本作为预测集,其余4份作为基学习器的训练集进行训练,训练完成后对预测集样本进行预测;将每个基学习器的5个样本预测值纵向叠加得到新的特征,第一层学习器得到新特征依次为A1、A2、A3、A4,再将新特征与原始特征合并作为第二层模型的数据集;
S7、通过Adaboost算法建立第二层机器学习器模型,通过第二层机器学习器模型对目标特征进行预测并输出结果。
2.如权利要求1所述的基于Stacking集成学习的气象水文特征预测方法,其特征在于,
所述步骤S1中原始数据集中的数据70%作为训练集,剩余30%作为预测集。
3.如权利要求1所述的基于Stacking集成学习的气象水文特征预测方法,其特征在于,所述步骤S2中对原始数据集中的数据特征进行相关性分析和数据集预处理包括:
通过相关性系数X,Y依次选取为原始数据集中各气象水文特征,计算比较原始数据集中的数据两两特征的相关性,若|ρ|<0.3则特征之间不存在线性关系,0.3<|ρ|<0.5则为低度线性关系,0.5<|ρ|<0.8为显著线性关系,|ρ|0.8为高度线性关系,通过生成皮尔逊相关性热力图查看各个气象水文特征与输出特征的相关系数以及特征之间的相关程度。
4.如权利要求3所述的基于Stacking集成学习的气象水文特征预测方法,其特征在于,
所述步骤S3包括:
选取既定个与目标特征相关系数绝对值大于0.3的特征并进行归一化处理,将原始特征数据线性化转换到[0 1]范围内,归一化公式为:X依次选取原始数据集中各气象水文特征,Xnorm为该特征归一化后的数据,Xmax、Xmin分别为该特征原始数据集中的最大值、最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111582505.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业质量管理系统及方法
- 下一篇:一种基于软件故障补充用例库的方法和系统