[发明专利]基于集成学习的雪茄烟采收成熟度识别方法及系统有效
| 申请号: | 202210800957.9 | 申请日: | 2022-07-08 |
| 公开(公告)号: | CN114862858B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 杨春雷;孙光伟;杨锦鹏;余君;饶雄飞;裴文灿;刘小伟;刘竞;黄金国 | 申请(专利权)人: | 湖北省烟草科学研究院 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06V10/30;G06V10/762;G06V10/764;G06V10/774;G06K9/62;G06N20/00;G06N20/20 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 徐瑛 |
| 地址: | 430030 湖北省*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 集成 学习 雪茄烟 采收 成熟度 识别 方法 系统 | ||
1.基于集成学习的雪茄烟采收成熟度识别方法,其特征在于,包括:
获取待测雪茄烟图像,并对所述待测雪茄烟图像进行预处理;对雪茄烟图像进行预处理包括:使用非局部平均去噪算法对雪茄烟图像进行去噪;接着使用暗通道去雾算法对去噪后的雪茄烟图像进行去雾;最后使用图像色彩校正算法对去雾后的雪茄烟图像进行色彩校正;
对预处理后的待测雪茄烟图像进行矢量化降维,并提取RGB、HSV特征值,得到特征集合;对预处理后的待测雪茄烟图像进行矢量化降维,进一步包括:提取雪茄烟图像中上万个像素点的颜色特征值,得到数据为[图长,图宽,颜色特征值通道数]的矩阵,将数据矢量化为[图长*图宽,颜色特征值通道数]的矩阵,得到聚类前的图像数据;将聚类前的图像数据导入K-Means算法,选取聚类数量R,聚类得到图像数据中的R种颜色特征值;用R种类的质心处像素点的颜色特征值替代当前类下所有像素点的颜色特征值;
利用Wrapper包装算法对特征集合中的数据进行特征降维,得到待测雪茄烟图像的初始数据集;特征降维包括:数据无量纲化;利用Wrapper包装算法的特征选择和算法训练同时进行的特点,依靠识别模型自身学习需求进行特征选择,从当前的一组特征中修剪最不重要的特征,在修剪的特征集合上递归地重复特征选择和算法训练同时进行的过程,直到最终到达所需数量的要选择的特征子集;
将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果。
2.根据权利要求1所述基于集成学习的雪茄烟采收成熟度识别方法,其特征在于,将初始数据集输入训练好的随机森林模型中,输出所述雪茄烟图像的成熟度识别结果,之前还包括:
获取大量雪茄烟图像样本,并对所述雪茄烟图像样本进行预处理;
对预处理后的待测雪茄烟图像进行矢量化降维,并提取RGB、HSV特征值,得到特征集合;
对特征集合中的数据进行雪茄烟成熟度等级编码;
对特征集合中的所有样本数据进行无量纲化操作,并利用Wrapper包装算法对所有样本数据进行特征降维,得到所有样本的初始数据集;
根据Bagging集成法,将初始数据集作为模型输入,将雪茄烟成熟度等级编码作为模型识别标签,使用随机森林算法对初始数据集进行建模,构建随机森林模型;
将初始数据集中的特征集合和对应的雪茄烟成熟度等级编码按照预设的比例划分为训练集数据和测试集数据;
输入训练集数据对构建的随机森林模型进行训练,得到训练好的随机森林模型。
3.根据权利要求1或2所述基于集成学习的雪茄烟采收成熟度识别方法,其特征在于,在进行雪茄烟成熟度等级编码或进行无量纲化操作之前,对特征集合中的数据进行数据清洗,包括对特征集合中的数据进行缺失值和异常值处理。
4.根据权利要求2所述基于集成学习的雪茄烟采收成熟度识别方法,其特征在于,所述方法进一步包括:
将决策树模型作为基评估器,构建多个相互独立的基评估器,并对多个基评估器按照Bagging原则进行集成,得到随机森林模型;
将多个基评估器的识别结果通过平均或者多数表决原则来决定随机森林模型的识别结果,得到强评估器,用于对雪茄烟成熟度等级的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北省烟草科学研究院,未经湖北省烟草科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210800957.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动封装设备组的上料系统
- 下一篇:一种渣土改良效果评价的试验方法





