[发明专利]一种基于深度学习和图像处理的小物件检测方法有效
申请号: | 201811605116.2 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109685145B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 李卫军;吴超 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/70;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 处理 物件 检测 方法 | ||
本发明涉及图像处理领域,更具体的,涉及一种基于深度学习和图像处理的小物件检测方法,本发明通过把原始Inception模块的5x5的卷积替换为两个3x3的卷积核,保留了更多的细节,同时为了加快训练速度和输出一致性,在每个分支的最后加入了BN,即Batch Normalization,进行批量归一化处理,同时引入残差网络结构,增加准确率,而且本发明采用反卷积增强相邻两层的高层和底层的上下文信息,将上层反卷积的结果与底层卷积曾像素对齐一一相加,得到的新的特征图作为检测的特征图,可以提高对小物体的识别,本发明在不影响传统SSD的高FPS的前提下,提高传统SSD对小物体检测的准确率。
技术领域
本发明涉及图像处理领域,更具体的,涉及一种基于深度学习和图像处理的小物件检测方法。
背景技术
目前,常用的对物体进行检测的算法是SSD,即Single Shot MultiBoxDetection。SSD是一种基于深度学习的端到端的检测框架,它的框架主要分为两个部分:第一部分是位于前端的卷积神经网络(VGG16),用于对目标进行特征提取,后端是多尺度特征检测网络,将前段网络产生的特征层进行不同尺度条件下的特征提取;然后将Conv4_3,Conv7,Conv8_2,Conv9_2,Conv10_2,Conv11_2各层进行卷积得到坐标位置和置信度得分,最后通过非极大值抑制(non maximum suppression,NMS)得到结果。
但是由于SSD是采用的是多尺度检测的方法,这种方法会减少计算量有很高的FPS,并且由于是在不同尺度的特征图上进行检测,不同尺度的特征图上的卷积感受野就会不同,特别是在高层卷积层,它的感受野就会很大,提取的特征也很抽象,所以对小物体的和细节的检测上很不敏感。
发明内容
为了解决现有技术中SSD检测算法对小物件检测不敏感的不足,本发明提供了一种基于深度学习和图像处理的小物件检测方法。
为实现以上发明目的,采用的技术方案是:
一种基于深度学习和图像处理的小物件检测方法,包括以下步骤:
步骤S1:获取数据集,数据集中包括已标注的物体类别信息和目标框的左上(xmin,ymin)和右下(xmax,ymax)两个点的坐标信息的原始图片,从数据集的训练集中任意选取一张带标签信息的图片,将图片调整到300x300的大小作为输入;
步骤S2:将图片沿着水平(0,150)(300,150)和竖直方向(150,0)(150,300)分割成大小为150x150的4部分P1,P2,P3,P4;另外取以(75,75)(225,75)(75,225)(225,225)为四个顶点坐标的图像作为第5部分P5;
步骤S3:根据每张输入图片带的目标框的左上和右下两个坐标信息(xmin,ymin),(xmax,ymax)判断图片中的物体有没有被分割,并根据物体被分割的情况修改坐标;
步骤S4:运用三次内插法对图片进行插值,使被分割的大小为150x150的5部分图片P1、P2、P3、P4、P5与原始图片300x300的大小相同,并命名为F1,F2,F3,F4,F5,同时将步骤S3得到的修改后的坐标乘以2并进行更新;
步骤S5:对F1,F2,F3,F4,F5五张图片的每一张经VGG16网络提取特征,再用3x3x1024大小的卷积核进行卷积得到大小为19x19x1024的Conv6特征图,再继续用1x1x1024大小的卷积核进行卷积得到大小为19x19x1024的Conv7特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811605116.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序