[发明专利]一种基于分级预测卷积神经网络的害虫图像分类方法有效
申请号: | 201710103514.3 | 申请日: | 2017-02-24 |
公开(公告)号: | CN107016405B | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 余健;谢成军;张洁;李瑞;陈天娇;陈红波;王儒敬;宋良图 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分级 预测 卷积 神经网络 害虫 图像 分类 方法 | ||
技术领域
本发明涉及预测分类技术领域,具体来说是一种基于分级预测卷积神经网络的害虫图像分类方法。
背景技术
害虫是农作物生长中的大敌,在农作物整个生长期内都有发生,可造成农作物大量减产。现行的害虫识别、分类工作主要是依靠少数植保专家和农技人员来完成的。但害虫种类繁多,每一位植保专家穷其所能也只能识别部分害虫。越来越多的迹象表明,对害虫分类需求的增多与害虫分类专家相对较少的矛盾已日益加剧。当今在模式识别领域,基于深度学习的学习算法成为众多学者研究的热点,在计算机视觉领域被广泛应用,如人脸识别、图像分类、图像分割等,并取得了较好的效果。然而,应用在害虫图像自动分类方法及系统则出现识别率不高、鲁棒性较差的问题,这也是由于害虫样本的多样性、特征复杂度所导致的。
因此,如何针对害虫的样本标签,利用有监督的神经网络技术实现害虫识别已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中害虫图像分类正确率低的缺陷,提供一种基于分级预测卷积神经网络的害虫图像分类方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于分级预测卷积神经网络的害虫图像分类方法,包括以下步骤:
对训练图像进行收集和预处理,收集若干幅图像作为训练图像,所有训练图像均进行大小归一化处理,将其处理为256×256像素,得到若干个训练样本;
对图像样本数据进行标注,对样本图片内容进行人工标注,标注出图像分割边界、类别和害虫种类,将图像分割成害虫、作物、背景三类,结合训练样本作为训练样本数据集合;
训练基于分级预测卷积神经网络的分类模型,训练基于分级预测卷积神经网络的分类模型,将训练样本作为输入,完成神经网络分类模型的训练;
对待测图像进行预处理,将待测的害虫图像按256×256像素进行归一化处理,得到新的待测图像;
基于分级模型自动进行害虫图像分类,将处理后的待测图像输入经过训练的分级预测卷积神经网络模型中,进行害虫图像种类的自动识别。
所述的训练基于分级预测卷积神经网络的分类模型包括以下步骤:
训练基于FCNN的图像分割网络模型;
设置层数为7层的全卷积网络层,输入训练样本,使用人工标注的病虫、作物、背景分割结果作为学习标注,利用深度学习框架Caffe进行网络模型的训练,输出为能够对害虫图像进行分割的全卷积神经网络模型;
训练基于CNN的图像分类模型,
设置层数为8层的卷积分类网络,将根据训练好的分割模型分割后获得的害虫、作物、背景三幅图像,加上未分割的整体图像,总共四幅图像作为输入,人工标注的害虫分类结果作为学习标注,利用深度学习框架Caffe进行网络模型的训练,输出图像分类模型。
所述的基于分级模型自动进行害虫图像分类包括以下步骤:
将待测图像输入到训练好FCNN分割模型中,获得图像中害虫、作物、背景的分割预测结果;
根据分割预测结果对原始图像进行分割,得到三幅新图像:害虫图像、作物图像、背景图像;
将待测图像和分割得到的害虫图像、作物图像、背景图像共四幅图像作为输入,输入到训练完成的基于CNN的分类模型中,预测得到可能性最大的分类作为分类结果输出。
所述的训练基于FCNN的图像分割网络模型包括以下步骤:
构建7层全卷积网络结构,每层卷积网络的大小如下:
第一层卷积核大小为11x11,特征图个数为96;第二层卷积核为5x5,特征图个数为256;第三、四、五层卷积核均为3x3,特征图个数分别为384、384、256;第六、七层卷积核均为1x1,特征图个数分别为512、3;
最后一个卷积层的输出大小为27x27x3,其中27x27是图像二维空间大小,3是分割类的数目,任意27X27位置上的3个目标值根据其每个位置感受野所属的害虫、作物还是背景来定,如果感受野中包括不止一个类别,使用占最多像素个数的那个类别来作为标注;
针对27X27的每个位置,在3个类别上进行softmax操作,最终损失函数为在27X27位置上的softmax损失之和L,其计算公式如下:
其中为位置(h,w)上的标注分割类别,M为分割类别的数目,等于3;
基于网络和目标函数的定义,输入训练样本数据,基于随机梯度下降算法进行模型训练优化。
所述的训练基于CNN的图像分类模型包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710103514.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有防水漏电功能的配电箱
- 下一篇:一种应急电源快速接入装置