[发明专利]一种基于图像深度的多分支多尺度小目标检测方法有效
申请号: | 201911415059.6 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111414931B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈婧;王其超;彭伟民;徐海涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/762 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 深度 分支 尺度 目标 检测 方法 | ||
本发明公开了一种基于图像深度的多分支多尺度小目标检测方法,包括根据双目图像训练集,获取视差图训练集;对视差图进行深度聚类,每一个聚类结果即为一个分支,将聚类结果映射到双目图像中的左图中,提取出初步候选框;分支提取图像特征:不同分支进行不同尺度的上采样操作,获取不同尺度特征图像;将不同尺度特征图像输入到多尺度特征金字塔网络中进行特征融合,获取预测结果;计算分类损失和回归框损失,结合预测结果,获取检测结果。可以有效的识别远距离小目标,提高了远距离小目标的检测在目标检测中的准确度。
技术领域
本发明涉及目标检测技术领域,尤其涉及一种基于图像深度的多分支多尺度小目标检测方法。
背景技术
在计算机视觉领域中,目标检测是一个非常活跃的、具有挑战性的研究方向,与分类任务不同,目标检测除了需要识别目标的类别以外,还要定位目标的位置,从而实现定位和识别的任务,在很多现实生活中的应用都与它息息相关。
现有的目标检测方法有二维检测方法和三维检测方法,二维检测方法能提供目标物体在二维图像中的位置和对应类别的置信度,但是由于其缺乏深度信息,不能判断物体的远近距离,难以获得检测目标的速度、方向等信息,准确度较低。二维图像中解决小目标最常用的方法是通过上采样来调整网络中输入图像的尺寸,但是,图像金字塔效率较低,因此出现了一些从特征角度出发的工作,导致网络计算变得较为复杂。三维检测方法存在以下问题:(1)针对小物体目标的检测,没有采用更有效的策略。小目标物体由于携带的信息少,因此特征表达能力弱,无法有效的对小目标物体进行准确识别;(2)需要加入一些人工信息,用来弥补缺失的深度信息。这些特定的人工信息以及单一的彩色图像,会限制场景的扩展以及神经网络有效地学习三维空间信息;(3)另外,由于三维检测加入了深度信息,获取这些特征需要花费更长的时间,增加了检测时长。
发明内容
本发明主要解决原有的远距离小目标的检测在目标检测中准确度较低的技术问题;提供一种基于图像深度的多分支多尺度小目标检测方法,对视差图进行深度聚类,每一个聚类结果即为一个分支,对不同分支进行不同尺度的图像特征提取,再在多尺度特征金字塔中进行特征融合,得到预测结果,将预测结果经分类损失和回归损失优化后得到最终检测结果,可以有效的识别远距离小目标,提高了远距离小目标的检测在目标检测中的准确度。
本发明的上述技术问题主要是通过下述技术方案得以解决的:本发明包括下列步骤:
S1、根据双目图像训练集,获取视差图训练集;
S2、对视差图进行深度聚类,每一个聚类结果即为一个分支,将聚类结果映射到双目图像中的左图中,提取出初步候选框;
S3、分支提取图像特征:不同分支进行不同尺度的上采样操作,获取不同尺度特征图像;
S4、将不同尺度特征图像输入到多尺度特征金字塔网络中进行特征融合,获取预测结果;
S5、计算分类损失和回归框损失,结合预测结果,获取检测结果。
对视差图进行深度聚类,将聚类结果映射到双目图像中的左图中,提取出初步候选框,每一个聚类结果(初步候选框)即为一个分支,对不同分支进行不同尺度的图像特征提取,再在多尺度特征金字塔中进行特征融合,得到预测结果,将预测结果经分类损失和回归损失优化后得到最终检测结果,可以有效的识别远距离小目标,提高了远距离小目标的检测在目标检测中的准确度。基于视差图提取初步候选框,能够消除目标表面纹理对检测的影响,加快了检测速度。
作为优选,所述的步骤S2中的对视差图进行深度聚类,具体包括如下步骤:
S21、根据视差图中的距离信息,划分K个深度范围,并随机选择K个深度范围的初始中心;
S22、将整体视差图分成若干个小区域,对每个小区域进行如下操作:求小区域到各个深度范围中心的距离,将小区域归属到距离最短的中心所在的深度范围;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911415059.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于旋转电机的转子芯
- 下一篇:多色温全光谱LED太阳灯照明控制系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序