[发明专利]一种图像中基于深度学习的小目标的检测方法及装置在审
申请号: | 201710820882.X | 申请日: | 2017-09-13 |
公开(公告)号: | CN107610113A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 马华东;刘武;程鹏 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙)11413 | 代理人: | 马敬,项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 基于 深度 学习 目标 检测 方法 装置 | ||
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像中基于深度学习的小目标的检测方法及装置。
背景技术
图像中目标的检测在各个领域应用广泛,例如,在自动驾驶领域中,图像中交通指示牌的检测是非常重要的环节,其目的是检测图像中的交通指示牌位置,进而通过交通指示牌的识别,指导车辆的行驶,保证行车安全。
图像中目标的检测技术中,Faster r-cnn(加速区域卷积神经网络)检测器最为常用。该检测器由三个部分构成,特征提取器,区域生成网络及区域分类网络,在实际检测前需要对Faster r-cnn检测器进行训练。在实际检测过程中,首先将图像输入特征提取器中进行卷积运算,得到整张图像的特征图。然后将得到的特征图送入区域生成的网络中,通过区域生成网络的卷积运算,确定有可能成为候选框的矩形框的坐标,坐标表示为(x1,y1,x2,y2),其中(x1,y1)表示矩形框的左上角的坐标,(x2,y2)表示矩形框的右下角的坐标,通过这两个坐标可以唯一确定矩形框的位置。最后将特征图和候选框的坐标(x1,y1,x2,y2)输入区域分类网络中,区域分类网络根据候选框的坐标提取出整张特征图中候选框的特征,根据其包含的特征与类别的对应关系,得到候选框中物体的类别,并根据候选框中物体在图像中的宽和高,对候选框的坐标进行精调,于是可以得到类别为检测目标的候选框和精调后的候选框坐标,完成图像中目标的检测,可以理解的是,精调后的候选框坐标对应的区域即为图像中目标所在区域。
在上述方法中,对于在图像中面积较小的目标,由于特征提取器得到的特征图中特征信息非常少,这意味着难以进行分类,检测器在检测像交通指示牌之类的小目标时是非常困难的。例如,Faster r-cnn的特征提取器采用的VGG16(牛津VGG深度卷积网络)的架构,对于最后一层卷积层来说,特征提取器的提取出来的特征图相比于原图像缩小16倍。这意味着当目标在原图像中的像素不足16*16的时候,在特征图中,该目标的特征将小于1个像素。即使区域生成网络准确的提供了目标的位置,由于目标的特征信息少于一个像素,特征信息太过稀少,区域分类网络也无法进行分类。
发明内容
本发明实施例的目的在于提供一种图像中基于深度学习的小目标的检测方法及装置,以提高对图像中面积较小的目标的检测准确率。具体技术方案如下:
第一方面,本发明实施例提供了一种图像中基于深度学习的小目标的检测方法,所述方法包括:
获取待检测图像;
基于所述待检测图像及预先训练完成的目标检测器模型,获得所述待检测图像中目标的类别及其在所述待检测图像中位置坐标,其中,所述目标检测器模型包括目标特征提取器、目标区域生成网络、预先建立的上下文信息层及目标区域分类网络,所述获得所述目标的类别及其在所述待检测图像中位置坐标的过程包括:
将所述待检测图像输入所述目标特征提取器,对所述待检测图像进行第一预设卷积运算,得到特征图;
将所述特征图输入所述目标区域生成网络,对所述特征图进行第二预设卷积运算,得到候选框的坐标;
将所述候选框坐标输入所述上下文信息层,根据候选框坐标,按照预设计算方式进行计算,得到垂直候选框坐标及水平候选框坐标;
将所述垂直候选框坐标、水平候选框坐标、候选框坐标及所述特征图输入所述目标区域分类网络,根据所包含的特征与类别的对应关系、所述垂直候选框坐标、水平候选框坐标、候选框坐标及所述特征图,得到所述目标的类别及位置坐标。
可选的,所述将所述候选框坐标输入所述上下文信息层,根据候选框坐标,按照预设计算方式进行计算,得到垂直候选框坐标及水平候选框坐标的步骤,包括:
将所述候选框坐标输入所述上下文信息层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710820882.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序