[发明专利]基于极端梯度提升算法的植被指数预测方法、系统及设备有效
申请号: | 201910905212.7 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110852475B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 荆文龙;刘杨晓月;李勇;杨骥;夏小琳 | 申请(专利权)人: | 广州地理研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 潘桂生 |
地址: | 510075 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 极端 梯度 提升 算法 植被 指数 预测 方法 系统 设备 | ||
本发明涉及一种基于极端梯度提升算法的植被指数预测方法、系统及设备,通过以植被指数作为因变量,以全球陆地数据同化系统流域地表模型数据集和高程数据作为自变量,构建极端梯度提升模型,利用极端梯度提升模型对所述样本数据进行迭代学习,预测目标时间段的植被指数,获取植被指数预测结果。相对于现有技术,本发明解决了现有技术中植被指数缺失问题,用户可利用本发明实现任意时间段的植被指数预测,完善植被指数数据。
技术领域
本发明涉及地理信息技术领域,尤其是涉及一种基于极端梯度提升算法的植被指数预测方法、系统及设备。
背景技术
植被指数是从多光谱遥感数据中提取的、能够有效度量地表植被状况的数值,与植被的覆盖度、生物量等有较好的相关性。然而,现有的植被指数数据涉及的时间周期较短,尚没有提取长时间植被指数的方法,而长时间植被指数在反应区域地表植被情况及周期性变化及研究区域生态环境承载力上具有重要作用。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种获取预设时间段植被指数的基于极端梯度提升算法的植被指数预测方法、系统及设备。
一种基于极端梯度提升算法的植被指数预测方法,包括以下步骤:
获取植被指数数据,选取预设时间段内的所述植被指数数据作为训练数据集,根据预设的规则从所述训练数据集选取高质量像元值作为第一输入数据;
将预设时间段内的全球陆地数据同化系统流域地表模型数据集以每半月进行整合,生成半月尺度的第二输入数据;
获取预设时间段内的高程数据,以植被指数作为因变量,以全球陆地数据同化系统流域地表模型数据集和高程数据作为自变量,构建极端梯度提升模型;
其中,所述极端梯度提升模型以若干决策树作为学习单元,根据上一决策树输出结果与实际值的残差拟合下一决策树,通过对若干决策树输出结果进行求和获得植被指数预测值;
获取目标时间段的全球陆地数据同化系统流域地表模型数据,将所述第一输入数据、第二输入数据、高程数据和目标时间段的全球陆地数据同化系统流域地表模型数据作为极端梯度提升模型的样本数据,利用极端梯度提升模型对所述样本数据进行迭代学习,预测目标时间段的植被指数,获取植被指数预测结果;
所述以植被指数作为因变量,以全球陆地数据同化系统流域地表模型数据集和高程数据作为自变量,构建极端梯度提升模型的步骤包括:
设定数据集所述极端梯度提升模型的学习单元的损失函数为迭代次数t和决策树的棵树k,令迭代次数t和决策树的棵树k在设定的数据集中进行遍历,验证精度并选取精度最高的迭代次数t和决策树的棵树k作为所述极端梯度提升模型参数;其中,xi为自变量,n为数据集样本数,yi为实际输出结果,为所述极端梯度提升模型输出结果;
按照以下方式获取极端梯度提升模型第t次的预测值
其中,为所述极端梯度提升模型t-1次的输出结果,ft(xi)为决策树第t次迭代输出结果;
在训练数据集中随机有放回抽取若干子集K,每个子集生成一棵决策树,对每一棵决策树进行训练,获得残差
按照以下方式最小化训练损失函数:
其中,γ为正则项系数;
对所述若干决策树的预测结果进行求和,获得植被指数预测值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州地理研究所,未经广州地理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910905212.7/2.html,转载请声明来源钻瓜专利网。