[发明专利]一种基于NAM和YOLOv3的目标检测方法在审
申请号: | 202211670444.7 | 申请日: | 2022-12-25 |
公开(公告)号: | CN115861651A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 王春峰;彭鹏 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 nam yolov3 目标 检测 方法 | ||
本发明提出了一种基于NAM和YOLOv3的目标检测方法,使得平均检测精度得到提升。基于注意力机制的YOLOv3模型侧重增强图像中的重点空间和通道,抑制空间或通道中不显著特征,保证了网络学习性能。首先选择目标检测领域公开PASCALVOC数据集;其次,构建YOLOv3模型,将上述数据集传入模型训练,使用Adam算法和StepLR学习率调整策略,评价模型性能;再者,训练嵌入NAM注意力机制的YOLOv3模型,同时完成性能评估;最后,与经典YOLOv3模型比较,分析测试结果。本发明提出了基于NAM和YOLOv3的目标检测方法,相比YOLOv3模型,在通用数据集上提升了平均检测精度,更适用于多个物体未全部检测时的情况。此外,该嵌入模块也能够融入其余模型中用于对比实验,具有较好的适用性和鲁棒性。
技术领域
该发明属于图像识别领域,涉及一种基于NAM和YOLOv3的目标检测方法,该方法在目标检测领域公开的PASCALVOC数据集上具有不错的检测性能。
背景技术
目标检测主要涉及传统目标检测技术以及基于深度学习的目标检测技术。随着科学技术的高速发展及机器智能化的广泛应用,传统的目标检测技术已经不能满足应用中的实际需求。由于深度学习理论与技术飞速发展,卷积神经网络在特征提取方面的表现越来越好,因此基于深度学习的目标检测技术应运而生,目前已发展成了目标检测领域的主流方法。
基于深度学习的目标检测技术,大致可以被分为两类:一类是基于候选区域,另一类是基于回归。基于候选区域也叫二阶段方法(Two-Stage),该类方法将检测任务划分为两个步骤:1、在图片上产生若干候选区域;2、对候选区域通过卷积神经网络进行目标分类和定位。主要方法有R-CNN、Fast R-CNN、Faster R-CNN等,这类方法检测精度高、检测速度慢。基于回归也叫一阶段方法(One-Stage),这类方法利用卷积神经网络的卷积特征,直接回归物体的类别概率和位置坐标值。主要方法有SSD、YOLO系列方法。
所谓注意力机制(Visiual Attention),就是从大量信息中筛选出有用信息的一种资源分配手段,重点关注所需信息,然后投入更多注意力到这些地方,以获得所需要目标的细节信息,而忽略掉不重要的区域。对于计算机视觉而言,注意力机制就是通过学习得到一个权重分布,再把权重分布施加到原来的特征上面,从而获取更多所需要关注目标的细节信息,抑制其它无用信息。注意力机制可分为3类:通道注意力机制、空间注意力机制、混合注意力机制。本文将NAM注意力机制嵌入到目前经典方法YOLOv3中检测其性能,与原始模型相比,本文改进的模型在精度上提升了0.56%,此外,该模块使网络在几乎不添加参数的情况下能够自动学习进行跨维度的交互,提升有效的特征通道权重,从而使网络重点关注重要的特征通道,加强特征提取能力。与原模型相比,本文改进的模型在精度上有所提升,该模块也能够嵌入其他经典模型中做对比实验。
发明内容
本发明方法提出了一种基于NAM和YOLOv3的目标检测方法,通过嵌入NAM注意力机制,使YOLOv3模型的检测性能有了一定程度的提升。
步骤一:下载目标检测领域公开的PASCALVOC数据集,解压到一个名为VOCdevkit的目录中,保证与该领域通用数据集保持一致,实现达到对比效果,检测本发明方法性能;下载地址为:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar;
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar;
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar;
VOC数据集提供了20个物体类别,本发明使用的数据集的图片中,标注了目标的分类信息pName、目标所在的中心位置坐标(x,y)和目标的宽度w及高度h,且通过矩形框将其可视化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211670444.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏发电用硅材料及其制备方法
- 下一篇:一种保温防寒鞋