[发明专利]一种土壤酸化驱动力的识别方法、系统和装置在审
申请号: | 201810120651.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108446433A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 王琦;李芳柏;刘建锋;于焕云;孙蔚旻;郝冬梅 | 申请(专利权)人: | 广东省生态环境技术研究所 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510650 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机森林 土壤酸化 数据误差 自变量 研究区域 因子变量 贡献率 驱动力 驱动 模型适用性 环境建模 输入驱动 数据缺失 精准度 因变量 高维 污染源 创建 应用 | ||
1.一种土壤酸化驱动力的识别方法,其特征在于:包括以下步骤:
获取研究区域内土壤酸化的驱动因子的数据和研究区域内的土壤酸化数据;
以所述土壤酸化数据作为因变量,以驱动因子作为自变量,对随机森林模型进行训练;
根据得到的随机森林模型,使用随机森林模型的袋外数据误差计算自变量的贡献率。
2.根据权利要求1所述的一种土壤酸化驱动力的识别方法,其特征在于:所述根据得到的随机森林模型,使用随机森林模型的袋外数据误差计算自变量的贡献率,这一步骤具体包括:
根据得到的随机森林模型,计算随机森林模型整体的袋外数据误差,以及每一个自变量的袋外数据误差;
根据得到的整体的袋外数据误差和每一个自变量的袋外数据误差计算自变量的贡献率。
3.根据权利要求2所述的一种土壤酸化驱动力的识别方法,其特征在于:所述随机森林模型整体的袋外数据误差的计算公式为:
其中,OOBMSEt表示袋外数据误差,yi表示第i个样本的实测值,表示第i个样本的预测值,t表示随机森林中树的编号,OOBt表示树t的袋外数据,nOOBt表示树t的袋外数据的数量;
所述自变量的袋外数据误差的计算公式为:
其中,OOBMSEt(Xjpermuted)表示自变量Xj的袋外数据误差,Xjpermuted表示随机排列的每棵树t中的每个自变量Xj。
4.根据权利要求3所述的一种土壤酸化驱动力的识别方法,其特征在于:所述根据得到的整体的袋外数据误差和每一个自变量的袋外数据误差计算自变量的贡献率,这一步骤具体包括:
将每一个自变量的袋外数据误差与整体的袋外数据误差相减;
对相减得到的结果进行降序排列,排序越前的差值所对应的自变量贡献越大。
5.根据权利要求1所述的一种土壤酸化驱动力的识别方法,其特征在于,还包括以下步骤:
将获取的土壤酸化驱动因子的数据进行分辨率均一化处理。
6.根据权利要求1所述的一种土壤酸化驱动力的识别方法,其特征在于,还包括以下步骤:
使用偏相关分析每个驱动因子与土壤酸度变化的非线性关系。
7.根据权利要求1所述的一种土壤酸化驱动力的识别方法,其特征在于,还包括以下步骤:
验证随机森林模型的拟合度以及通过十折交叉检验法估算随机森林模型的精度。
8.根据权利要求1所述的一种土壤酸化驱动力的识别方法,其特征在于:所述驱动因子包括自然驱动因子和人类驱动因子,所述自然驱动因子包括地质、土壤、地形和气象因子中的至少一种,所述人类驱动因子包括土地利用方式、农业产量、农业生产方式、工业布局、工业产量、种植结构、工业三废排放量、大气和水体中硫化物含量、氮氧化合物含量、臭氧含量、酸雨、土壤有机质含量、大气干湿沉降量、施肥量、第一产业国民生产总值和第二产业国民生产总值中的至少一种。
9.一种土壤酸化驱动力的识别系统,其特征在于,包括:
获取模块,用于获取研究区域内土壤酸化的驱动因子的数据和研究区域内的土壤酸化数据;
训练模块,用于以所述土壤酸化数据作为因变量,以驱动因子作为自变量,对随机森林模型进行训练;
计算模块,用于根据得到的随机森林模型,使用随机森林模型的袋外数据误差计算自变量的贡献率。
10.一种土壤酸化驱动力的识别装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于加载所述程序以执行如权利要求1所述的土壤酸化驱动力的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省生态环境技术研究所,未经广东省生态环境技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810120651.2/1.html,转载请声明来源钻瓜专利网。