[发明专利]一种基于改进YOLOv5的小目标检测算法在审
申请号: | 202111382559.1 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114241548A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 郭磊;薛伟;王邱龙;马海钰;肖怒;马志伟;郭济;蒋煜祺 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov5 目标 检测 算法 | ||
1.一种基于改进YOLOv5的小目标检测算法,其特征在于,包括:
步骤一,对所收集到的人脸口罩数据集进行数据标注,并使用Mosaic-8数据增强方法对数据集进行数据增强。
步骤二,在YOLOv5特征融合网络中添加一个新尺度的特征提取层,并调整YOLOv5网络的目标框回归公式,改进损失函数。将所得数据集中的图片进行特征提取与目标定位分类。
步骤三,将增强后的数据送入网络中进行迭代训练,并使用余弦退火算法对学习率进行调整。
步骤四,训练完成后,将待检测图片送入至训练后得到的最佳模型中,检测目标类别及位置,最终得到识别结果。
2.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本发明在原有YOLOv5算法的基础上,分别从Mosaic-8数据增强、特征提取器、损失函数和目标框回归四个方面进行改进,有效地增强了YOLOv5网络模型对小目标物体的检测精度,改进后的算法检测速率相较于原始YOLOv5算法有所降低,但仍能满足实时性的要求,可以直接应用在自动驾驶、医学图像、遥感图像分析和红外图像中的小目标检测等实际生活场景中。并且在密集人群口罩佩戴检测效果中表现突出,检测精度有明显上升,在人群密集的条件下误判和漏检的情况明显减少,对小目标异常角度、人脸区域存在遮挡的鲁棒性明显提升。
3.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本文数据集来源于WIDER FACE、MAPA(Masked Faces)这两个公开数据集和网络,从中手动筛选出含有多人场景下的佩戴口罩和未佩戴口罩的人脸图片,并对所收集到的人脸口罩数据集进行数据标注,最终得到训练集4000张,测试集1320张,共计5320张。
4.根据权利要求3所述的对所收集到的人脸口罩数据集进行数据标注,其特征在于,利用标记软件LabelImg对数据集进行YOLO格式的标注,共有两个标记类别,分别是bad(未佩戴口罩)和good(佩戴口罩)。
5.根据权利要求4所述的对数据集进行YOLO格式的标注,其特征在于,标注后的每一张图片都对应着一个与该图片名称相同的txt文件,txt文件中的每一行表示一个标记实例,共5列,从左到右分别表示标签类别、标记框中心横坐标与图片宽度的比值、标记框中心纵坐标与图片高度的比值、标记框宽度与图片宽度的比值、标记框高度与图片高度的比值。
6.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,使用Mosaic-8数据增强方法对其数据集进行数据增强,即采用8张图片随机裁剪、随机排列、随机缩放,然后组合成一张图片,以此来增加样本的数据量,同时合理引入一些随机噪声,增强网络模型对图像中小目标样本的区分力,提升模型的泛化力。
7.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,使用Mosaic-8数据增强方法对其数据集进行数据增强,实现丰富数据集的同时,增加了小样本目标,提升网络的训练速度。在进行归一化操作的同时,会一次性计算八张图片,因此模型对内存的需求降低。
8.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本发明在原始的YOLOv5特征提取模型的基础上进行改进,即本文在YOLOv5骨干网络的基础上对原始输入图片增加一个4倍下采样的过程,原始图片经过4倍下采样后送入到特征融合网络得到新尺寸的特征图,该特征图感受野较小,位置信息相对丰富,因此可以提升检测小尺寸口罩佩戴目标的检测效果。
9.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,改进后的特征融合网络将特征金字塔网络与路径聚合网络(PAN,Path Aggregation Network)相结合,特征金字塔网络自顶向下传递深层次语义特征,路径聚合网络自底向上传递目标的位置信息,通过自顶向下和自底向上的特征信息融合,使得模型可以更好地学习到特征,增强模型对小目标和遮挡目标的敏感度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111382559.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带耦合功能的宽带频率重组滤波电路
- 下一篇:一种光学中心标定方法及装置