[发明专利]一种基于卷积神经网络对图像中的铅笔进行精确计数的方法有效
申请号: | 202010115736.9 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111369503B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 蒋业凡;夏思宇 | 申请(专利权)人: | 东南大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T7/70;G06T5/00;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 图像 中的 铅笔 进行 精确 计数 方法 | ||
1.一种基于卷积神经网络对图像中的铅笔进行精确计数的方法,其特征在于,该方法包括以下步骤:
(1)搭建YOLO神经网络模型;
(2)对生产线上俯拍采集获得的铅笔图片进行预处理;
(3)对神经网络结构参数进行设定和训练参数初始化;
(4)将多种不同类型的铅笔图像作为一类数据进行数据增强;
(5)对获取的铅笔图像进行数据训练,得到网络权重和偏置;
(6)将待计数的铅笔图像输入神经网络模型,得到铅笔的精确数目;
在步骤(1)中,所述搭建YOLO神经网络模型的结构如下:
第一层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第二层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第三层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第四层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第五层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第六层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出依次经过LeakyRelu函数、2×2最大池化层;
第七层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出经过Leaky Relu函数;
第八层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出经过Leaky Relu函数;
第九层为卷积层,首先进行批量归一化,经过卷积核提取特征后,输出经过Leaky Relu函数;
第十层为卷积层,经过卷积核提取特征后,输出经过linear函数;
第十一层为YOLO层,使用6个anchor,进行数据增强和多尺度训练,最终得到目标的数目;
在步骤(3)中,YOLO网络结构参数设定和训练参数初始化如下:
(3.1)网络的输入图像大小为576*576*3,训练的batch大小设置为1,max_batches的大小设置为500200;
(3.2)网络中第一层、第二层和第六层的卷积层和最大池化层的步长设置为1,卷积层采用边缘补0的方式保持图像尺寸不变;
(3.3)网络中第三层、第四层和第五层的卷积层步长为1,最大池化层的步长为2,卷积层采用边缘补0的方式保持图像尺寸不变;
(3.4)初始学习率为1×e^(-3),调整学习率的策略为迭代固定的次数之后以一定的比例降低学习率,具体为20000次迭代后将学习率调整为1×e^(-4),450000次迭代后将学习率调整为1×e^(-5);
在步骤(5)中,所述对获取的铅笔图像进行数据训练的过程如下:
(5.1)在训练前,首先将搭建的神经网络在公开数据集VOC2007和VOC2012上进行预训练;
(5.2)将进行数据增强的铅笔图像作为神经网络的输入;
(5.3)损失函数由定位误差、置信误差和分类误差组成,对不同的部分采用了不同的权重值;
其中,定位误差指的是:
(1)预测的铅笔的中心点位置和真实的铅笔的中心点位置之间的误差;
(2)预测的铅笔的边框的大小和真实的铅笔边框的大小之间的误差;
其中,置信误差指的是:
(1)预测图像中存在铅笔的情况下,预测的铅笔的置信度和真实的铅笔的置信度的之间的误差;
(2)预测图像中不存在铅笔的情况下,预测的铅笔的置信度和真实的铅笔的置信度之间的误差;
其中,分类误差指的是预测的铅笔数量和真实的铅笔数量之间的误差;
其中,不同的权重指的是定位误差、置信误差和分类误差的不同的系数,具体的系数大小即为网络的超参数值,需要经过调试得到最优解;
(5.4)通过训练和交叉验证,得到网络的超参数值;将网络的超参数值进行重新设置,设置为学习得到的最优值,再次训练得到最终的神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010115736.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序