[发明专利]基于Stacking集成学习的气象水文特征预测方法及系统在审
申请号: | 202111582505.X | 申请日: | 2021-12-22 |
公开(公告)号: | CN114254767A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 张华军;占宇;苏义鑫;张丹红 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06N20/20 | 分类号: | G06N20/20;G06K9/62 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 姜婷 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 stacking 集成 学习 气象 水文 特征 预测 方法 系统 | ||
一种基于Stacking集成学习的气象水文特征预测方法,包括:S1、获取海上气象水文特征原始数据集,划分为训练集和预测集;S2、对原始数据集中的数据特征进行相关性分析和数据集预处理;S3、选取既定个与目标特征相关系数较大的特征并进行归一化处理;S4、对所选特征向量进行降维去噪,生成新的特征向量;S5、搭建第一层机器学习器模型;S6、将每个基学习器的5个样本预测值纵向叠加得到新的特征,第一层学习器得到新特征依次为A1、A2、A3、A4,再将新特征与原始特征合并作为第二层模型的数据集;S7、建立第二层机器学习器模型,对目标特征进行预测并输出结果。
技术领域
本发明涉及航海安全规划中气象水文特征预测技术领域,特别涉及一种基于Stacking集成学习的气象水文特征预测方法及系统。
背景技术
随着世界经济的迅速发展,海上航行随之越来越频繁。因此,确保海上航行安全不仅是对生命健康的保护,也是有益于全球经济发展的一项重要措施。研究表明,船舶事故的两个主要原因中约60%由火灾、碰撞、机器故障等非自然因素造成,其余40%的船舶事故是由于恶劣天气造成的。目前,尽管风和浪的预报水平有所提高,但复杂多变的海洋气候继续对危险海洋条件的预报和预警构成严重挑战。在预测海洋气象条件时,海洋气象中心将注意海况参数的临界值,预测并警告危险的风和浪。然而,海洋气候条件复杂多变,需要更准确的海洋状况信息,以协助进行航线规划、预报和预警。因此,迫切需要研究各类气象水文特征并进行预测,从而综合评价海上航线的安全系数,进而提高海上安全航线的预警和预报水平。由于单个机器学习器对气象水文特征的预测效果在单个方面表现较好,但模型稳定性弱,所以本发明提出一种基于Stacking集成学习的气象水文特征预测方法,该方法通过利用集成学习组合多个弱监督模型得到一个更好更全面的强监督模型,从而降低模型预测的偏差和方差,提高模型的稳定性,使得气象水文特征的预测结果更加准确,对于海上航行的气象水文特征预测与航线规划具有非常重要的应用价值。
发明内容
有鉴于此,本发明提供一种基于Stacking集成学习的气象水文特征预测方法及系统。
一种基于Stacking集成学习的气象水文特征预测方法,包括如下步骤:
S1、获取海上气象水文特征原始数据集,将原始数据集中的数据划分为训练集和预测集;
S2、对原始数据集中的数据特征进行相关性分析和数据集预处理;
S3、选取既定个与目标特征相关系数较大的特征并进行归一化处理,将原始特征数据线性化转换到[0,1]范围内;
S4、运用PCA主成分分析法对所选特征向量进行降维去噪,降维至预定维数生成新的特征向量;
S5、搭建第一层机器学习器模型,该第一层机器学习器模型包括四个并列且不同的基学习器:SVR、随机森林、Lasso回归、ElasticNet回归;
S6、第一层采用5折交叉验证训练,将训练集分成5等份样本,依次将其中1份样本作为预测集,其余4份作为基学习器的训练集进行训练,训练完成后对预测集样本进行预测;将每个基学习器的5个样本预测值纵向叠加得到新的特征,第一层学习器得到新特征依次为A1、A2、A3、A4,再将新特征与原始特征合并作为第二层模型的数据集;
S7、通过Adaboost算法建立第二层机器学习器模型,通过第二层机器学习器模型对目标特征进行预测并输出结果。
在本发明所述的基于Stacking集成学习的气象水文特征预测方法中,
所述步骤S1中原始数据集中的数据70%作为训练集,剩余30%作为预测集。
在本发明所述的基于Stacking集成学习的气象水文特征预测方法中,所述步骤S2中对原始数据集中的数据特征进行相关性分析和数据集预处理包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111582505.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业质量管理系统及方法
- 下一篇:一种基于软件故障补充用例库的方法和系统