[发明专利]一种基于高光谱特征筛选和机器学习的兰花营养预测方法在审
| 申请号: | 202211631992.9 | 申请日: | 2022-12-19 |
| 公开(公告)号: | CN116011323A | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 冯垚;张小芳;吴沙沙;李爽;翟俊文;王娟;陈露;李科涛;邓淑雯;李青女 | 申请(专利权)人: | 宁德卫星大数据科技有限公司;福建农林大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06Q10/04;G06N20/00;G06N5/01;G06N3/096;G01N21/25;G01N33/24 |
| 代理公司: | 福州旭辰知识产权代理事务所(普通合伙) 35233 | 代理人: | 程春宝 |
| 地址: | 352100 福建省宁德市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 光谱 特征 筛选 机器 学习 兰花 营养 预测 方法 | ||
1.一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,所述方法包括如下步骤:
步骤S1:利用便携式地物光谱仪和机载高光谱成像仪采集兰花叶片反射光谱,使用土壤养分检测仪测定兰花叶片的营养素含量;
步骤S2:对采集的光谱数据和兰花叶片的理化值进行数据清洗及预处理,理化值即上述步骤S1中所述的营养素含量;
步骤S3:对兰花数据进行处理及特征筛选;
步骤S4:用线性和非线性机器学习模型模拟兰花叶片的营养素含量;
步骤S5:最后根据模型评估指标好坏对模型进行反复调参,以达到最好的拟合效果。
2.根据权利要求1所述的一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,步骤S2进一步具体为:对数据进行缺失值处理和异常值检测,同时对光谱反射率进行噪声消除;缺失值的处理方法有随机森林填补,均值填补和众数填补;异常值检测算法有四分位数及绘制箱线图、孤立森林、3σ/sigmaσ法和Z-score方法;噪声消除有标准化校正、多元散射校正、SG平滑和一阶导数方法。
3.根据权利要求1所述的一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,步骤S3进一步具体为:对兰花数据进行批量特征衍生,创建新的特征;接着以特征重要性、相关系数、熵值、权重指标为标准来筛选兰花的衍生特征,删除冗余衍生特征;特征重要性、相关系数的绝对值、熵值变化量越大,权重值越高,说明该特征波段对兰花营养素影响越大,以此完成敏感特征的筛选。
4.根据权利要求3所述的一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,批量特征衍生的方法有有单变量、多变量、四则运算、多项式,交叉组合方法;筛选特征变量的方法有:有方差过滤、相关性分析、互信息法、递归特征消除法,随机森林特征重要性方法。
5.根据权利要求1所述的一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,步骤S4进一步具体为:用机器学习算法从兰花训练数据中学习并执行模拟任务,该机器学习算法包括随机森林、XGBoost、AdaBoost,梯度提升决策树算法。
6.根据权利要求1所述的一种基于高光谱特征筛选和机器学习的兰花营养预测方法,其特征在于,步骤S5进一步具体为:根据数据质量及样本的数量进行首次模型参数设置,模型参数有学习器的个数、粗剪枝和整体学习速率;接着,对模型效果进行评估,检验模型预测数值的准确性和模型拟合的覆盖情况,常用评估指标有可决系数、均方根误差、均方误差、平均绝对百分比误差,根据上述评估指标的大小,再次对机器学习模型进行调参,其中可决系数越接近1评估指标越好,均方根误差、均方误差、平均绝对百分比误差越小评估指标越好,最终得到预测兰花营养状态的反演模型,通过反演模型进行兰花营养的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁德卫星大数据科技有限公司;福建农林大学,未经宁德卫星大数据科技有限公司;福建农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211631992.9/1.html,转载请声明来源钻瓜专利网。





