[发明专利]一种基于邻近尺度特征滤除与转移的物体检测方法有效
申请号: | 201910861981.1 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110738113B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 庞彦伟;李亚钊 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/774;G06V10/80;G06V10/52;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻近 尺度 特征 转移 物体 检测 方法 | ||
本发明涉及一种基于邻近尺度特征滤除与转移的物体检测方法,包含下列步骤:收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容为每一个物体的坐标位置,每一个物体的类别,每一张图像的语义分割结果,以其作为图像标签信息。设计物体检测主干卷积神经网络,基于该主干卷积神经网络,提取多层级的物体特征。得到尺度敏感的物体多层级特征。基于尺度敏感的多层级特征,建立尺度敏感的物体检测子,回归和分类对应尺度的物体。输入数据,前向计算预测结果和损失代价,通过反向传播算法计算参数的梯度并更新参数。迭代的更新参数,待代价函数曲线收敛时,模型训练完毕。
技术领域
本发明涉及计算机视觉领域中高性能的物体检测方法,特别是涉及采用深度学习方法进行图像/视频中物体检测的方法。
背景技术
人工智能成为国际竞争的新焦点。基于深度学习的物体检测技术作为人工智能领域的一项关键技术,在智能监控、人机交互、辅助驾驶以及当前重点发展的无人驾驶中具有广泛重要的应用。物体检测技术主要实现对场景中人、车以及其他感兴趣类别物体的实时位置检测与识别,实现对场景的深度理解。
以自动驾驶系统为例,物体检测技术用于检测道路上行驶的车辆、行人以及障碍物等,辅助实现车辆行驶、变道、刹车等操作,保证车辆的安全行驶。其具体应用过程示例如图1所示。实现自动驾驶系统中的物体检测,首先通过车载相机捕获现实驾驶场景中的视频/图像信息;进一步地,将相机采集的图像/视频信息输入到已经嵌入车辆系统中的物体检测算法中;运行物体检测算法,输出所检测到的物体的位置信息和类别信息;辅助车辆决策系统,根据物体检测的结果,制定车辆行驶路线,实现安全的自动驾驶。作为自动驾驶中的关键技术,物体检测的性能直接关系到车辆的安全程度,提升物体检测精度和效率是进一步推动自动驾驶技术发展的关键。
现有的物体检测方法主要是基于深度学习的物体检测方法。Girshick等人[1][2]提出基于深度卷积神经网络的物体检测算法,通过神经网络提取深度特征并生成候选框,进而对候选框进行再次回归得到最终的检测结果,该方法是一种双阶段的物体检测方法。Redmon等人[6]为进一步提升物体检测的效率,提出一种单阶段的物体检测算法,即通过卷积神经网络直接回归出物体位置和分类结果,显著提升了物体检测的效率。然而,由于真实场景中不同物体的尺寸不同,且实际物体距离相机的远近程度不同,造成在成像图像/视频中不同物体存在较大的尺度差异。该尺度问题成为限制物体检测性能提升的瓶颈。如图1中的图像所示,图片中存在较大尺度的车辆,尺度较小的行人,以及远处微小尺度的行人,如何同时检测出各个尺度的物体是提升物体检测性能的关键。
现有的缓解尺度问题的方法主要有:Liu等人[3]提出在多个特征尺度上检测对应尺度的物体,实现多尺度物体检测。Lin[4][5]提出一种自顶向下的特征金字塔的方法,实现特征的多层级融合,并在特定层的特征上检测对应尺度的物体。现有的多尺度物体检测的方法主要聚焦在设计多个尺度敏感的检测子,一定尺度上提升了物体检测的性能。然而,这些方法忽略了多尺度物体检测中对尺度敏感特征的需求。在检测小物体时,其所采用的特征不仅包含了小尺度的物体特征,也包含了中尺度和大尺度物体的特征,由于大中尺度物体特征通常较为显著,其对小物体的检测造成干扰,限制了尺度敏感检测子的检测性能。此外,由于检测大尺度物体的检测子采用深层特征,在金字塔中,该特征没有得到增强,使得金字塔对大尺度物体的检测性能提升有限,仍然存在物体检测效果不佳的问题,无法有效满足实际物体检测的需要。
参考文献:
[1]R.Girshick.Fast R-CNN.IEEE International Conference on ComputerVision.IEEE Computer Society,2015:1440-1448.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910861981.1/2.html,转载请声明来源钻瓜专利网。