[发明专利]基于感受野增强和注意力引导聚合的目标检测方法及装置在审
| 申请号: | 202310513345.6 | 申请日: | 2023-05-08 |
| 公开(公告)号: | CN116580274A | 公开(公告)日: | 2023-08-11 |
| 发明(设计)人: | 程杰仁;唐柱;唐湘滟 | 申请(专利权)人: | 海南大学 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/764;G06N3/0464;G06V20/70 |
| 代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 姜子朋 |
| 地址: | 570100 *** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 感受 增强 注意力 引导 聚合 目标 检测 方法 装置 | ||
本申请实施例公开了一种基于感受野增强和注意力引导聚合的目标检测方法及装置,属于计算机视觉领域。所述方法包括:特征图输入骨干网络模块提取图像特征,得到不同特征层次的特征图,选取部分不同特征层的特征图;输入选取的部分不同特征层的特征图到感受野增强模块,扩大特征感受野,提取多尺度特征信息;根据不同特征层的特征两两融合的方式,输入不同特征层的特征图到注意力引导融合模块融合特征,提高特征融合的质量,降低噪声信息干扰。因此,本申请实施例可以在终端设备和其他资源受限环境下,缩小网络规模,降低模型对存储空间的要求,平衡检测精度和速度。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种基于感受野增强和注意力引导聚合的目标检测方法及装置。
背景技术
目标检测是计算机视觉中最根本也是最具有挑战性和吸引性的问题之一,近年来更是受到了广泛的研究与探索。自深度学习在目标检测方面的应用之后,图像分类任务的效果显著提高,并在实践中得到了广泛应用。基于深度学习的目标检测算法根据算法思想的不同可以分为两种:Two-Stage Detectors(例如:the proposal-based methods FastR-CNN、Faster R-CNN)和One-Stage Detectors(例如:the regression-based methodsSSD、YOLO)。虽然他们在速度和精度方面都有不俗的表现,但是他们的参数量和计算量却不容小觑,这一点限制了它们在计算资源有限的终端设备上的应用。
YOLO_v3是单阶段算法的代表作,它借助残差连接将原来YOLO_v2的骨干网络DarkNet-19扩展为拥有53个卷积层的DarkNet-53。而更深的网络层次让DarkNet-53表现出更强大的特征提取能力,优于同时期的ResNet-101和ResNet-152。YOLO_v3还采用自上而下的特征金字塔结构融合来自骨干网络的3个不同尺度的有效特征层。但是,由于骨干网络庞大的参数量和有限的特征提取能力以及特征金字塔在融合不同层次特征时无法弥补信息之间的差异性,导致特征融合效果差,YOLO_v3在准确度和速度方面仍有待优化。
发明内容
本申请实施例提供了一种基于感受野增强和注意力引导聚合的目标检测方法及装置。所述技术方案如下:
第一方面,本申请实施例提供了一种基于感受野增强和注意力引导聚合的目标检测方法,所述方法应用于卷积神经网络中,所述卷积神经网络包括改进的YOLO_v3网络,其中,所述改进的YOLO_v3网络又包括:骨干网络模块、感受野增强模块、注意力引导融合模块;所述方法包括:
输入特征图到所述骨干网络模块提取图像特征,得到不同特征层的特征图,选取部分所述不同特征层的特征图;
输入所述选取的部分所述不同特征层的特征图到所述感受野增强模块,扩大特征感受野,提取多尺度特征信息;
根据不同特征层的特征两两融合的方式,输入不同特征层的特征图到注意力引导融合模块融合特征,提高特征融合的质量,降低噪声信息干扰。
可选的,所述输入特征图到所述骨干网络模块提取图像特征之前,还包括:
选取EfficientNet_B2网络替换原骨干网络Darknet-53;
删除所述EfficientNet_B2网络最后的分类层进行改进,得到新的骨干网络,嵌入YOLO_v3网络。
可选的,所述感受野增强模块包括:跨阶段局部网络模块和IASPP模块,其中,所述IASPP模块在传统的ASPP模块的每个分支的空洞卷积前添加池化和卷积操作,增强模型的鲁棒性和泛化能力,弥补空洞卷积造成的特征稀疏。
可选的,所述跨阶段局部网络模块将输入的特征图一分为二,通过所述跨阶段局部网络模块的跨阶段局部结构将两部分所述特征图合并。
可选的,所述跨阶段局部网络模块将输入的特征图一分为二之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310513345.6/2.html,转载请声明来源钻瓜专利网。





