[发明专利]基于特征融合的小目标检测方法、装置、设备及存储介质在审
申请号: | 202210543582.2 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114863196A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 李攀;张佳帅;张涌;宁立;许宜诚 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06V10/771 | 分类号: | G06V10/771;G06V10/774;G06V10/80 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 刘建伟 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 融合 目标 检测 方法 装置 设备 存储 介质 | ||
本发明公开了一种基于特征融合的小目标检测方法、装置、设备及存储介质,其中方法包括:对预先获取到的低维的输入特征图进行尺寸变换,得到高维特征图;将高维特征图在通道域上按通道的权值共享融合高维的语义信息到空间域,并再次采样,得到重采样特征图;对输入特征图和重采样特征图进行融合,得到融合特征图;输入融合特征图至预先训练好的目标检测模型,得到小目标检测结果。本发明通过尺寸变换和重采样的方式,将低维的输入特征图与经过尺寸变换和重采样得到的高维特征图进行融合,有助于保留小目标物体的空间信息,从而挺高了目标检测模型对小目标物体检测和识别的准确性,而且处理的参数少,计算量小,处理效率更高。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于特征融合的小目标检测方法、装置、设备及存储介质。
背景技术
目标检测是计算机视觉中的一项基本问题,主要目的是确定图像中是否存在给定类别的对象实例(例如人,汽车,自行车,狗或猫),如果存在,则返回每个对象实例的空间位置和范围,其可以模仿人类视觉对外界环境进行判断,广泛的应用在行人检测、人脸检测、智慧交通中。随着近些年深度学习的快速进步,目标检测与其相结合得到了更好的检测精度,更快的效率以及发展出更广泛的应用,比如自动驾驶、人机交互,而小目标在图像场景中比较常见,而且因为分辨率低、包含信息少、噪点多而难以被检测。在目前目标检测的算法中,小目标检测的准确率仅仅只有大目标检测准确率的一半,因此为提高目标检测算法的普适性与多场景应用型,迫切的需要一种高效的小目标检测方法。
目前,针对小目标检测上存在的检测难、漏检问题,可利用逆卷积操作将高层特征图与低层特征图相融合,丰富前几层的语义信息,最终生成具有高分辨率高语义信息的单个高级特征图,以检测出图像中的小目标;或者是采用YOLOv5算法,在YOLOv5骨干提取网络中添加协调注意力机制,从而使移动网络获得更大区域的信息而避免引入大的开销,针对密集、相互遮挡的小目标,使用Varifocal Loss来训练密集目标,使得网络模型面对大面积聚簇重叠的目标时,能够准确识别。但是,上述两种方式中,逆卷积或转置卷积需要处理的额参数量过大,会影响整体训练的效率,而且转置卷积相对于普通卷积运算,其特征提取能力并不高,会影响整体的检测精度;而将注意力机制加入骨干网络的方法会提高网络整体概括语义信息的能力,但是通道注意力计算过程中需要对特征图进行全局平均池化操作,这会掩盖掉小目标的空间信息,不利于最终的检测效果。
发明内容
有鉴于此,本申请提供一种视频优化方法、装置、终端设备及存储介质,以解决现有的小目标检测模型检测准确率不高、效率低下的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于特征融合的小目标检测方法,包括:对预先获取到的低维的输入特征图进行尺寸变换,得到高维特征图;将高维特征图在通道域上按通道的权值共享融合高维的语义信息到空间域,并再次采样,得到重采样特征图;对输入特征图和重采样特征图进行融合,得到融合特征图;输入融合特征图至预先训练好的目标检测模型,得到小目标检测结果。
作为本申请的进一步改进,对预先获取到的低维的输入特征图进行尺寸变换,得到高维特征图,包括:获取预设的上采样因子以及输入特征图的尺寸(C*W*H),C为输入特征图的通道数,W为输入特征图的宽度值,H为输入特征图的高度值;基于上采样因子将通道数划分为γ2个分组,γ为上采样因子;对输入特征图进行上采样操作,以将每组中相同位置的参数值按顺序放置在生成的上采样图的对应位置,得到尺寸变换后的高维特征图,高维特征图的尺寸为(C′*2W*2H),其中,C′=C/γ2,C′为高维特征图的通道数。
作为本申请的进一步改进,将高维特征图在通道域上按通道的权值共享融合高维的语义信息到空间域,并再次采样,得到重采样特征图,包括:基于预设规则,根据高维特征图的通道数生成每个空间位置的重采样核;将高维特征图的通道数划分为预设数量个分组;将每个分组分别与对应空间位置的重采样核进行相乘后按空间域进行值的累加,得到待生成的重采样特征图的每个空间位置的参数值;对每个空间位置的参数值进行二维展开,得到重采样特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210543582.2/2.html,转载请声明来源钻瓜专利网。