[发明专利]一种基于机器学习的风暴潮灾预警模型训练及预警方法在审
申请号: | 202210362689.7 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114677034A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 李红泽;苏凤鸣;罗慧瑜;吴仲维 | 申请(专利权)人: | 联通(广东)产业互联网有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06K9/62;G06N20/00 |
代理公司: | 广州润禾知识产权代理事务所(普通合伙) 44446 | 代理人: | 郑永泉 |
地址: | 510000 广东省广州市黄埔区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 风暴 预警 模型 训练 方法 | ||
1.一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,包括以下步骤:
获取风暴潮灾样本特征数据以及所述风暴潮灾样本特征数据对应的样本预警结果,构造样本数据集;
将所述样本数据集作为输入,对机器学习模型进行训练、验证,得到最优模型,将所述最优模型作为风暴潮灾预警模型;
其中,所述风暴潮灾特征数据包括:台风特征数据、降水特征数据以及风速特征数据,所述台风特征数据通过采集得到,所述降水特征数据以及风速特征数据通过所述台风特征数据计算得到。
2.根据权利要求1所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,所述台风特征数据包括:台风中心与基站距离;
所述降水特征数据通过所述台风特征数据计算得到,具体包括:
所述降水特征数据通过所述台风特征数据,采用以下公式,计算得到:
其中,D表示台风中心与基站距离。
3.根据权利要求2所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,所述台风特征数据还包括:台风等级;
所述风速特征数据通过所述台风特征数据计算得到,具体包括:
所述风速特征数据通过所述台风特征数据,采用以下公式,计算得到:
其中,表示在当前台风等级下,台风中心最大风速与台风中心距离为D的基站风速的比值。
4.根据权利要求1所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,获取风暴潮灾样本特征数据以及所述风暴潮灾样本特征数据对应的样本预警结果,具体包括:
获取风暴潮灾样本特征数据以及所述风暴潮灾样本特征数据对应的样本预警结果;
根据所述风暴潮灾样本特征数据对应的样本预警结果,将所述风暴潮灾样本特征数据划分为多数类样本以及少数类样本;
根据所述少数类样本,采用Smote采样算法,合成新样本,并将所合成的新样本添加至所述风暴潮灾样本特征数据中,实现样本扩充。
5.根据权利要求4所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,根据所述少数类样本,采用Smote采样算法,合成新样本,具体包括:
对于所述少数类样本中每一个少数类样本X,以欧氏距离为标准计算所述少数类样本X到所述少数类样本中其它样本的距离,得到所述少数类样本X对应的近邻;
根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个所述少数类样本X,从所述少数类样本X对应的近邻中随机选择若干个近邻
对于每一个所述少数类样本X,以及所述少数类样本X对应的每一个近邻采用以下公式,合成新样本:
其中,Xnew表示合成的新样本,表示少数类样本X和近邻的距离,rand(0,1)表示随机在0~1之间取值。
6.根据权利要求1所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,将所述样本数据集作为输入,对机器学习模型进行训练、验证,得到最优模型,具体包括:
将所述样本数据集作为输入,采用K-fold交叉验证方式,对机器学习模型进行训练、验证,得到最优模型。
7.根据权利要求1所述的一种基于机器学习的风暴潮灾预警模型训练方法,其特征在于,所述机器学习模型为XGBoost模型,所述XGBoost模型目标函数为:
其中,t为当前基学习器索引,T为当前基学习器叶子结点数,Gj和Hj表示第j个叶子节点中样本的一阶偏导数之和以及二阶偏导数之和,λ、γ为可调节参数;
所述XGBoost模型的分裂增益为:
其中,表示左子树结构分数,表示右子树结构分数,表示不分割结构分数。
8.一种基于机器学习的风暴潮灾预警方法,其特征在于,包括以下步骤:
获取待预测的风暴潮数据;
利用基于权利要求1 7任一项所述的方法训练得到的风暴潮灾预警模型对所述待预测的风暴潮数据进行预警预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联通(广东)产业互联网有限公司,未经联通(广东)产业互联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210362689.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理