[发明专利]一种基于改进YOLOv5的小目标检测算法在审
申请号: | 202111382559.1 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114241548A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 郭磊;薛伟;王邱龙;马海钰;肖怒;马志伟;郭济;蒋煜祺 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov5 目标 检测 算法 | ||
本发明公开了一种基于改进YOLOv5的小目标检测算法,所述方法包括:第一步,将采集到的待测人脸口罩数据集使用Mosaic‑8数据增强,即采用8张图片随机裁剪、随机排列、随机缩放,然后组合成一张图片,同时合理引入一些随机噪声。第二步,在YOLOv5特征融合网络中添加一个新尺度的特征提取层,并调整YOLOv5网络的目标框回归公式,改进损失函数。第三步,将增强后的数据送入网络中进行迭代训练,并使用余弦退火算法对学习率进行调整。第四步,训练完成后,将待检测图片送入至训练后得到的最佳模型中,检测目标类别及位置,最终得到识别结果。将改进后的算法应用在密集人群情景下的防护面具佩戴检测中,实验结果表明,相较于原始YOLOv5算法,该算法在小目标检测上具有更强的特征提取能力和更高的检测精度。
技术领域
本发明涉及小目标检测技术领域,具体涉及一种基于改进YOLOv5的小目标检测算法。
背景技术
目标检测作为计算机视觉领域的核心问题之一,是利用图像处理、深度学习等技术,从图像或视频中定位感兴趣的对象,通过目标分类判断输入图像中是否包含目标,用目标定位找出目标物体位置并框出目标,其任务是锁定图像中的目标,定位目标位置、确定目标类别,被广泛应用于人脸识别、自动驾驶、行人检测、智能监控等计算机视觉领域。传统的目标检测算法由3部分组成,分别是区域选择、特征提取和分类器,但由于其存在手工设计的特征鲁棒性差、区域选择策略没有针对性等特点,检测效果并不理想。
早期的目标检测方法是使用手工提取特征,再在此基础上构造模型。使用该方法设计的模型不仅结构复杂,而且难以提升精度。随着深度学习的发展,人们发现卷积神经网络具有极好的学习特征的能力,基于深度卷积神经网络的特征提取技术被广泛应用到计算机视觉任务中,目标检测完成了从基于传统手工设计特征的检测方法到基于卷积神经网络的深度学习方法的变迁,随后基于卷积神经网络的目标检测算法迅速成为图像处理领域研究的主流。卷积神经网络相比于传统的手工设计的提取算子提取的特征更加丰富,模型的泛化能力更强。
虽然目前这些优秀的目标检测算法在大型通用的数据集上已经取得了非常好的成绩,但小目标检测长期以来就是目标检测中的重点和难点之一,目标检测中对小目标的定义通常有两种,一种是相对尺寸大小,另一种是根据具体的数据集对小目标进行定义。相比于常规目标,小目标在图像中所占的像素数较少,分辨率低,信息量少,特征表达能力弱。早期的目标检测方法是使用手工提取特征,再在此基础上构造模型。使用该方法设计的模型不仅结构复杂,而且难以提升精度,检测模型在检测速度上仍有一定差距。
发明内容
本发明的目的是提出一种基于改进YOLOv5的小目标检测算法,通过使用Mosaic-8方法进行数据增强,增加一个浅层特征图,调整损失函数增强网络对小目标的感知能力,通过修改目标框回归公式,解决训练过程中梯度消失等问题,提升小目标检测精度。
为了实现上述任务,改善现有技术存在的缺陷,本发明提供了一种基于改进YOLOv5的小目标检测方法,包括:
第一步,将采集到的待测人脸口罩数据集使用Mosaic-8数据增强,即采用8张图片随机裁剪、随机排列、随机缩放,然后组合成一张图片,同时合理引入一些随机噪声。
第二步,在YOLOv5特征融合网络中添加一个新尺度的特征提取层,并调整YOLOv5网络的目标框回归公式,改进损失函数。
第三步,将增强后的数据送入网络中进行迭代训练,并使用余弦退火算法对学习率进行调整。
第四步,训练完成后,将待检测图片送入至训练后得到的最佳模型中,检测目标类别及位置,最终得到识别结果。
进一步地,所述小目标检测模型的搭建包括:
在原始YOLOv5的基础上,在Backbone骨干网络和Head网络中,新增尺寸为输入图像尺寸四分之一的特征图,提升对小目标数据的挖掘,采用多尺度反馈以引入全局上下文信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111382559.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带耦合功能的宽带频率重组滤波电路
- 下一篇:一种光学中心标定方法及装置