[发明专利]一种建立有机高粱产量预测模型的方法在审
申请号: | 202010926712.1 | 申请日: | 2020-09-07 |
公开(公告)号: | CN111985728A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 张华;孙守伟;耿云涛 | 申请(专利权)人: | 浪潮软件股份有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/02 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建立 有机 高粱 产量 预测 模型 方法 | ||
1.一种建立有机高粱产量预测模型的方法,其特征在于,包括以下步骤:
第一步,构建训练数据集
将有机高粱的成长周期分为种植初期,成长期和成熟期三个时期,并将种植的基础属性,种植时期的自然环境数据和田间管理数据的历史数据作为模型的初始解释变量,将种植地块的历史产量记录作为模型的响应变量,根据有机高粱的成长阶段分别汇总成三份模型训练数据集;
第二步,数据预处理
对三份训练数据集进行预处理,包括观察数据集中的异样数据点,剔除可疑的人为错误录入的信息;
第三步,变量筛选
为了提高模型的稳定程度与预测精度,对预处理完后的数据进行变量筛选,筛选出15个最重要的特征变量,并将特征变量进行共线性问题测试;
第四步,训练模型
将有机高粱产量数设为响应变量,将其他影响有机高粱产量的特征变量作为模型的解释变量,以三份不同成长期的有机高粱的训练数据作为训练数据集对模型进行训练;
第五步,模型诊断
观察以及调整模型变量以及评测模型的可行性,不断循环调整直至达到建模者的要求以及评判参考系数为止;
第六步,模型应用
将训练好的有机高粱产量在种植初期,成长期以及成熟期的三份模型分别保存到后台大数据集群中,方便后期用户调用。
2.根据权利要求1所述的建立有机高粱产量预测模型的方法,其特征在于:所述第一步中,训练数据集由以下三个部分组成:
种植的基础属性,包括土地的面积、土壤温度、土壤湿度、土壤酸碱度以及特殊化学物质含量信息,通过人工记录以及土壤检测仪的检测获得;
种植时期的自然环境数据,包括近期温度变化,光照时间,以及特殊自然灾害的影响程度,通过本地气象观测站以及地块所在基站来采集获得;
田间管理数据,土地使用肥料量的记录,种子使用量,病虫草害的次数以及农技员现场支持次数,通过现场采集获得。
3.根据权利要求1或2所述的建立有机高粱产量预测模型的方法,其特征在于:所述第二步中,当训练数据集中某列特征数据存在空置情况时,若空置列占总列的5%以下,则在空置列中选择填充相应列平均值,否则删除该列特征数据或者人工对空置列进行填充。
4.根据权利要求1或2所述的建立有机高粱产量预测模型的方法,其特征在于:所述第三步中,使用数理统计中的方差膨胀系数概念衡量在回归建模中变量的共线性严重程度,剔除方差膨胀系数超过10的变量,得到三份不同成长期的有机高粱的训练数据作为有机高粱在不同时期产量的训练数据集。
5.根据权利要求4所述的建立有机高粱产量预测模型的方法,其特征在于:所述第四步中,采用Python语言中的Statsmodels专业回归建模扩展工具语言包对有机高粱产量预测模型进行编写,并将三份不同成长期的有机高粱的训练数据作为训练数据集对分别模型进行训练,从而得到三份不同成长期的有机高粱产量预测模型。
6.根据权利要求1或4所述的建立有机高粱产量预测模型的方法,其特征在于:所述第五步中,对模型的变量调整及测评,包括以下步骤:
S1.利用残差诊断图观察构建的模型与数据之间的拟合程度,并对离群异常点以及强影响的样本点进行观察,并将强影响的利群异常点在训练模型过程中剔除;
S2.通过对模型中的重要变量指标绘制统计学中的GAM图来评测变量的拟合次方是否合理并且添加备选模型方案;
S3.剔除模型统计诊断结果中T检验P值大于0.2的特征变量,因为T检验显示较高的特征变量与产量之间不存在显著的线形关系;
S4.计算候选模型的矫正决定系数,AIC赤池信息准则以及模型在测试数据集中所得到的均方误差和,最后比较挑选出对原数据解释力度和拟合程度最高的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010926712.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理