[发明专利]一种图像中的物体检测方法及装置有效
申请号: | 201611248557.2 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106780612B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 叶昕 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06K9/62;G06K9/46 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 中的 物体 检测 方法 装置 | ||
本发明实施例公开了一种图像中的物体检测方法及装置,用以提高物体检测的实时性,该方法中将待检测的图像输入到预先训练完成的卷积神经网络中,该卷积神经网络在图像中确定每个候选区域对应的特征向量,针对每个候选区域对应的特征向量,当特征向量中类别参数的最大值大于设定阈值时,确定所述候选区域包含的物体的类别,并根据所述特征向量中的位置参数,确定所述候选区域包含的物体的位置信息。由于本发明实施例采用卷积神经网络在进行检测时确定了候选区域,计算每个候选区域对应的特征向量,从而识别每个物体的类别和位置,无需进行重复操作,提高了检测的实时性。
技术领域
本发明涉及机器学习技术领域,特别涉及一种图像中的物体检测方法及装置。
背景技术
随着视频监控技术的发展,智能视频监控应用在越来越多的场景中,例如交通、商场、医院、小区、公园等等,智能视频监控的应用为各种场景中,通过图像进行物体检测奠定了基础。
现有技术在图像中进行物体检测时,一般采用基于候选区域-卷积神经网络(Region Convolutional Neural Network,R-CNN)及其延伸Fast RCNN和Faster RCNN。图1为采用R-CNN进行物体检测的流程示意图,其检测过程包括:接收输入图像,在图像中提取候选区域(region proposal),计算每个候选区域的CNN特征,并采用分类和回归的方法确定物体的类型和位置。上述过程中,需要在图像中提取出2000个候选区域,整个提取的过程需要耗时1~2s的时间,然后针对每个候选区域,需要计算该候选区域的CNN特征,而候选区域中有很多是存在重叠的,因此在计算CNN特征时也会存在很多的重复工作;并且该检测过程中还包括后续步骤:proposal的特征学习,以及对确定的物体的位置进行校正和消除虚检等处理,整个检测过程可能需要2~40s的时间,大大影响了物体检测的实时性。
另外,采用R-CNN进行物体检测的过程中,图像的提取是采用显著性检测(selective search)提取的,之后采用卷积神经网络计算CNN特征,最后再使用支持向量机模型(SVM)进行分类,从而确定物体的位置。而上述三个步骤都是相互独立的方法,没办法对整个检测过程进行整体优化。
图2为采用Faster RCNN进行物体检测的过程示意图,该过程采用卷积神经网络进行,每个滑动窗在中间层(intermediate layer)将会生成一个256维的数据,在分类层(clslayer)检测目标的类别,在回归层(reg layer)检测物体的位置。上述对物体的类别和位置的检测是两个独立的步骤,两个步骤中都需要针对256维的数据分别进行检测,因此该过程也将会增长检测的时长,从而影响物体检测的实时性。
发明内容
本发明实施例公开了一种图像中的物体检测方法及装置,用以提高物体检测的实时性,并便于对物体检测进行整体优化。
为达到上述目的,本发明实施例公开了一种图像中的物体检测方法,应用于电子设备,所述方法包括:
将待检测的图像输入到预先训练完成的第一卷积神经网络中,其中所述第一卷积神经网络在所述图像中识别每个包含物体的候选区域,对每个候选区域进行自适应下采样后进行全连接计算,确定每个候选区域对应的特征向量,其中所述特征向量中包含所述候选区域的位置参数和多个类别参数;
针对每个候选区域对应的特征向量,识别所述特征向量中类别参数的最大值,当所述最大值大于设定阈值时,确定所述候选区域包含的物体的类别为所述最大值的类别参数对应的类别,并根据所述特征向量中的位置参数,确定所述候选区域包含的物体的位置信息。
进一步地,所述位置参数包括物体所在矩形框的设定点的位置信息及所述矩形框的外形尺寸参数,所述根据所述特征向量中的位置参数,确定所述候选区域包含的物体的位置信息包括:
根据所述位置参数中的设定点的位置信息,确定物体所在矩形框的设定点在所述图像中的位置信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611248557.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序