[发明专利]物体检测方法、装置和系统及存储介质有效
申请号: | 201710740825.0 | 申请日: | 2017-08-25 |
公开(公告)号: | CN108875750B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 王志成;俞刚 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 检测 方法 装置 系统 存储 介质 | ||
本发明实施例提供一种物体检测方法、装置和系统及存储介质。方法包括:获取待检测图像;将待检测图像输入物体检测网络中的场景网络,以获得与待检测图像的场景信息相关的场景特征图;将待检测图像输入物体检测网络中的物体网络,以获得与待检测图像的物体信息相关的物体特征图,并确定用于指示物体特征图中的物体位置的第一数目的物体候选区域;对于第一数目的物体候选区域中的每一个,将该物体候选区域映射到场景特征图上,以确定与该物体候选区域对应的场景区域特征;将物体特征图中该物体候选区域的特征与对应的场景区域特征结合;以及将结合后的特征输入物体检测网络中的分类网络,以获得物体检测结果。本发明可以提升物体检测的准确率。
技术领域
本发明涉及图像处理领域,更具体地涉及一种物体检测方法、装置和系统及存储介质。
背景技术
物体检测是计算视觉领域的一个重要问题,也有着很广泛的应用,如:无人驾驶、机器人或安防场景中对特定物体(人或物)进行检测的技术。目前的物体检测方法主要是基于区域卷积神经网络(region-based convolutional neural networks,RCNN)的改进算法以及基于单阶梯形式的算法,而这些算法在训练阶段只采用用于物体检测的数据库(例如Pascal VOC、COCO、ImageNet-det等)进行训练。但是在实际情境下,人识别某个物体的时候是无形中受到场景的影响的,如:一个白色的球状物体如果出现在泳池里,结合场景信息很大几率地会被认为是泳帽,而如果出现在排球场,则更可能会被识别为排球。目前的物体检测方法往往通过加大感受野(reception field)来表示对场景信息的理解,而这种方式明显是一种近似方法,离真正的场景理解有很大距离,所以无法将场景理解在物体检测中的作用很好地发挥出来,从某种程度上影响了物体检测准确率的提升。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种物体检测方法、装置和系统及存储介质。
根据本发明一方面,提供了一种物体检测方法。该物体检测方法包括:获取待检测图像;将待检测图像输入物体检测网络中的场景网络,以获得与待检测图像的场景信息相关的场景特征图;将待检测图像输入物体检测网络中的物体网络,以获得与待检测图像的物体信息相关的物体特征图,并确定用于指示物体特征图中的物体位置的第一数目的物体候选区域;对于第一数目的物体候选区域中的每一个,将该物体候选区域映射到场景特征图上,以确定与该物体候选区域对应的场景区域特征;对于第一数目的物体候选区域中的每一个,将物体特征图中该物体候选区域的特征与对应的场景区域特征结合,以获得结合后的特征;以及对于第一数目的物体候选区域中的每一个,将结合后的特征输入物体检测网络中的分类网络,以获得物体检测结果。
示例性地,对于第一数目的物体候选区域中的每一个,将该物体候选区域映射到场景特征图上,以确定与该物体候选区域对应的场景区域特征包括:计算该物体候选区域与场景特征图中的预划分的场景区域中的每个场景区域的重叠度;选择重叠度最大的场景区域作为该物体候选区域的关联场景区域;以及从场景特征图中提取关联场景区域的特征作为与该物体候选区域对应的场景区域特征。
示例性地,对于第一数目的物体候选区域中的每一个,将该物体候选区域映射到场景特征图上,以确定与该物体候选区域对应的场景区域特征包括:对该物体候选区域进行缩放,以获得经缩放区域;确定场景特征图中与经缩放区域位置一致的区域为该物体候选区域的关联场景区域;以及从场景特征图中提取关联场景区域的特征作为与该物体候选区域对应的场景区域特征。
示例性地,对于第一数目的物体候选区域中的每一个,将结合后的特征输入物体检测网络中的分类网络,以获得物体检测结果包括:对于第一数目的物体候选区域中的每一个,将结合后的特征输入分类网络,以获得分类网络输出的、第二数目的物体候选区域中的每个物体候选区域的坐标和与每个物体候选区域对应的该物体候选区域属于每个预定类别的置信度;采用非最大值抑制算法对第二数目的物体候选区域进行过滤,以获得第三数目的物体候选区域;以及确定第三数目的物体候选区域中的每个物体候选区域的坐标和与每个物体候选区域对应的该物体候选区域属于每个预定类别的置信度为物体检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710740825.0/2.html,转载请声明来源钻瓜专利网。