[发明专利]基于图谱识别和深度学习的果实分类的分析方法在审

专利信息
申请号: 201810007712.4 申请日: 2018-01-04
公开(公告)号: CN108021910A 公开(公告)日: 2018-05-11
发明(设计)人: 白皓然;郭若皓;李凤梅;赵丽清;李娟;孟庆强;刘立钧;王高弟;白雨蒙 申请(专利权)人: 青岛农业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/08;B07C5/10;B07C5/342
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 266109 山东省青岛市城*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图谱 识别 深度 学习 果实 分类 分析 方法
【权利要求书】:

1.基于图谱识别和深度学习的果实分类的分析方法,其特征在于,包括如下步骤:

(1)收集水果果实在不同状态下的样本图片,使用图片裁剪工具对各样本图片进行裁剪,使整个果实完全位于图片内部,

(2)利用OpenCV图像处理的方法对存入的图像进行旋转,平移,特征缩放和分量均值零化,图片的旋转和平移可以增加样本图片的数量,增强数据源;特征缩放和分量均值零化可以实现图片特征的标准化,改善神经网络模型,

(3)将样本图片分为两批:训练集和测试集,训练集和测试集的比例为6:1;使用caffenet的create_imagenet.sh文件将图片存入到基于二叉树的数据库管理库LMDB中,并指定生成路径,

(4)修改solver、train_val配置文件,使用Caffe框架构建神经网络模型,

(5)使用python语言定义Caffe网络框架的每一层,每层参数按照下面11层神经网络计算结果设置,并设置batch_size(一次训练的图片数量)为50;test_iter(测试执行的迭代次数)为50,test_interval(测试频率)为20,base_lr(迭代速率)为0.001, momentum(动量参数)为0.9, weight_decay(权重衰减系数)为0.0005,梯度下降的优化策略使用inv,max_iter(最大迭代次数)10000,每迭代5000次生成一次快照,训练硬件设备选择GPU,使用命令:

./build/tools/caffetrain--solver=examples/my_simple_image/cifar/cifar10_quick_solver.prototxt开始训练数据,

(6)至此13类水果模型已经训练完毕,使用JupyterNoteBook对LOSS曲线进行绘制,观察曲线拟合情况,没有出现过拟合现象,曲线拟合完美,准确率达92.756%,从而完成对果实的分类分析。

2.根据权利要求1所述的基于图谱识别和深度学习的果实分类的分析方法,其特征在于,所述神经网络包括11层,输入为140*140,C1层是卷积层,形成8个特征图谱,特征图谱中的每个单元与输入层的一个5*5的相邻区域相连,即卷积的输入区域大小是5x5,每个特征图谱内参数共享,即每个特征图谱内只使用一个共同卷积核,卷积核有5x5个连接参数加上1个偏置共26个参数;卷积区域每次滑动一个像素,这样卷积层形成的特征图谱每个的大小是136*136;C1层共有(5*5+1)*8=208个训练参数,有(5*5+1)*8*136*136=3847168个连接;S2层是一个下采样层,C1层的8个136*136的特征图谱分别进行以2*2为单位的下抽样得到8个68*68的图;每个特征图谱使用一个下抽样核,每个下抽象核有两个训练参数,所以共有2*8=16个训练参数,有68*68*(2*2+1)*8=184960个连接;C3层是一个卷积层,卷积核和C1相同,C3层有10个68*68的卷积区域;C3层有(5*5+1)*10=260个训练参数,有(5*5+1)*10*64*64=1064960个连接;S4层是一个下采样层/池化层,C3层的10个64*64的特征图谱分别进行以2*2为单位的下抽样得到10个32*32的图;每个特征图谱使用一个下抽样核,每个下抽象核有两个训练参数,所以共有2*10=20个训练参数,有32*32*(2*2+1)*10=51200个连接;C5层是一个卷积层,卷积核和C3相同;C5层有12个28*28的卷及区域;C5层有(5*5+1)*12=312个训练参数,有(5*5+1)*12*28*28=244608个连接;S6层是一个下采样层/池化层,C5层的12个28*28的特征图谱分别进行以2*2为单位的下抽样得到12个14*14的图;每个特征图谱使用一个下抽样核,每个下抽象核有两个训练参数,所以共有2*12=24个训练参数,有14*14*(2*2+1)*12=11760个连接;C7层是一个卷积层,卷积核和C5相同,不同的是C7的每个节点与S6中的多个图相连;C7层有16个10*10的图,每个图与S2层的连接的方式采用组合连接(图3);这种不对称的组合连接的方式有利于提取多种组合特征;改成有(5*5*3+1)*6+(5*5*4+1)*3+(5*5*4+1)*6+(5*5*6+1)*1 =1516 个训练参数,共有1516*10*10=151600个连接;S8层是一个下采样层/池化层,C7层的16个10*10的特征图谱分别进行以2*2为单位的下抽样得到16个5*5的图;每个特征图谱使用一个下抽样核,每个下抽象核有两个训练参数,所以共有2*16=32个训练参数,有5*5*(2*2+1)*16=2000个连接;C9层是一个卷积层;由于S8层的16个图的大小为5*5,与卷积核的大小相同,所以卷积后形成的图的大小为1*1;这里形成120个卷积结果;每个都与上一层的16个图相连;所以共有(5*5*16+1)*120 = 48120个参数,同样有48120个连接;F10层是全连接层;该层的训练参数和连接数是(120+1)*84=10164;输出层11共有26个节点,分别代表13种水果和对应质量的优差。

3.根据权利要求1所述的基于图谱识别和深度学习的果实分类的分析方法,其特征在于,该方法具体实施步骤如下:

(1)利用IP摄像头,抓取图像数据;

(2)视频经过云传输和h.264解压缩被计算机获取;

(3)对样本图片进行裁剪,使水果整体位于图片中;

(4)在LinuxUbuntu系统下,利用OpenCV图像处理的方法对存入的图像进行旋转,平移,特征缩放和分量均值零化,利用图片的旋转和平移可以增加样本图片的数量,增强数据源;特征缩放和分量均值零化可以实现图片特征的标准化,改善神经网络模型;

(5)VS2013环境下,使用python语言定义Caffe网络框架的每一层,每层参数按照下面11层神经网络计算结果设置,并设置batch_size(一次训练的图片数量)为50;test_iter(测试执行的迭代次数)为50,test_interval(测试频率)为20,base_lr(迭代速率)为0.001, momentum(动量参数)为0.9, weight_decay(权重衰减系数)为0.0005,梯度下降的优化策略使用inv,max_iter(最大迭代次数)10000,每迭代5000次生成一次快照,训练硬件设备选择GPU,使用命令:

./build/tools/caffetrain--solver=examples/cnn_solver.prototxt开始训练数据;

(6)训练结束后生成LOSS损失曲线,对结果进行分析,检查拟合性,查找是否出现过拟合现象,经过多次调参调试后,准确率达到92.756%,保存模型;

(7)将生成的模型加入到Java代码中,采集到的每帧图像与模型比较,分析其特性,最终确定果实的特征分类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛农业大学,未经青岛农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810007712.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top