[发明专利]基于YOLOv5的尺度自适应目标检测的方法及存储介质在审
申请号: | 202210411140.2 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114926722A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 王福田;陈菲儿;汤进;赵海峰 | 申请(专利权)人: | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/40;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 苗娟 |
地址: | 230000 安徽省合肥市望江西路5089号,*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 yolov5 尺度 自适应 目标 检测 方法 存储 介质 | ||
本发明的基于YOLOv5的尺度自适应目标检测的方法及存储介质,包括实时采集待测图像,输入事先构建的目标检测模型中,计算输出置信度大于阈值的分类结果作为待测图像的识别结果;其中目标检测模型构建包括将获得的样本进行Mosaic数据增强,将数据增强后的样本输入模型网络中,将切片操作得到的新图片再经过卷积操作,然后将得到的特征图送入backbone中,提取样本的多层深度特征;将得到的特征图送入分层特征自适应融合模块;将得到的特征继续送入后续的网络中,实现网络前向传播以得到目标物体的边界框信息,本发明让每个样本自适应地选择合适的尺度,通过自适应融合机制来抑制低质量通道带来的噪声影响,以此实现目标检测的尺度自适应,提高目标检测的鲁棒性。
技术领域
本发明涉及计算机视觉领域,具体涉及一种基于YOLOv5的尺度自适应目标检测的方法及存储介质。
背景技术
目标检测是计算机视觉领域中的一个基础且具有挑战性的问题,其目的是识别图像中的所有感兴趣的对象的类别并确定其位置和大小。目标检测技术的应用也十分广泛,在人脸检测、车辆检测、行人计数、自动驾驶、医疗辅助等领域都有他的身影。
基于深度学习的目标检测算法主要分为两类:两阶段检测算法和一阶段检测算法。两阶段检测算法首先进行候选区域生成,即一个有可能包含待检物体的预选框,再通过卷积神经网络进行样本分类。常见的两阶段目标检测算法有:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN等。一阶段检测算法不用提取候选区域,直接在网络中提取特征来预测物体分类和位置。常见的一阶段目标检测算法有:YOLO、SSD和RetinaNet等。
现实场景中各类物体的外观、形状和姿态是不固定的,成像时光照、遮挡等因素也经常出现,目标检测面临的挑战也非常多。在图片中由于拍摄位置与角度的不同,加上成像设备会有镜头畸变,所以目标的尺度变化会很大。在卷积神经网络中,对于小物体而言,浅层特征包含它的一些细节信息,随着层数加深,感受野变大,所提取特征中的几何细节信息可能完全消失。对于大物体而言,它语义信息将出现在较深层特征中。
目前有很多针对多尺度目标检测的研究,比如采用多尺度训练的方法,将不同尺寸的图片送入训练网络,FPN也是多尺度的产物,它将顶层特征通过上采样和低层特征做融合之后再进行预测。YOLOv5也有对图片进行尺度变化的数据增强。YOLOv5在灵活性与速度上远强于其他检测算法,在模型的快速部署上具有极强优势,相比其他算法更符合工业界对目标检测算法实时性的要求,简单易实现,对于嵌入式很友好。但是单独使用YOLOv5无法完成多尺度目标高准确率的检测。
发明内容
本发明提出的一种基于YOLOv5的尺度自适应目标检测的方法,可提高YOLOv5对多尺度目标的检测精度,提高网络的鲁棒性与泛化性能。
为实现上述目的,本发明采用了以下技术方案:
一种基于YOLOv5的尺度自适应目标检测的方法,包括以下步骤,
步骤1:采集图像,然后将样本集按一定比例随机分为训练集和验证集;
步骤2:将步骤1获得的样本进行Mosaic数据增强,即随机使用4张图片,随机缩放,再随机分布进行拼接;
步骤3:将数据增强后的样本输入模型网络中,首先将样本送入fcous模块,对图片进行切片操作,将切片操作得到的新图片再经过卷积操作,最终得到了没有信息丢失情况下的二倍下采样特征图,然后将得到的特征图送入backbone中,提取样本的多层深度特征;
步骤4:将步骤3中得到的特征图送入分层特征自适应融合模块;先通过三个并行的网络组成的分层模块,三个网络的参数是共享的,只有空洞卷积的膨胀率不同,将提取到的多尺度特征送入自适应融合模块处理;在经过一个全局平均池化之后每个分支都连接一个全连接层,一起做SoftMax操作,与每个分支相乘后再做一个残差连接;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室),未经合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210411140.2/2.html,转载请声明来源钻瓜专利网。