[发明专利]基于改进YOLOV5的火灾检测方法在审
| 申请号: | 202210460452.2 | 申请日: | 2022-04-24 |
| 公开(公告)号: | CN114821423A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 王龙兴;刘为国 | 申请(专利权)人: | 王龙兴 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/42;G06V10/774;G06N3/04;G06N3/08 |
| 代理公司: | 北京百年育人知识产权代理有限公司 11968 | 代理人: | 刘朋 |
| 地址: | 232001 安徽省淮南*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 改进 yolov5 火灾 检测 方法 | ||
1.基于改进YOLOV5的火灾检测方法,包括火灾检测系统和改进后的YOLOv5目标检测算法,其特征在于:所述火灾检测系统包括监控部分、图像处理部分和报警部分组成,其中监控部分为摄像机监控,通过摄像机对所监控的区域实时监测,并将图像传输到图像处理部分,图像处理部分用于判断是否有火灾发生,报警部分为声音报警器,当确定发生火灾时,开始报警;
YOLOv5目标检测算法由三个部分组成,第一部分为输入端,输入图片通过数据增强、自适应锚框计算以及自适应图片缩放,得到640*640大小的图片;第二部分为主干网络,其使用的是CSPDarknet53网络,通过Conv层和C3层来对图像进行缩放和特征提取,从而获得更丰富的信息特征;第三部分为颈部,采用多尺度检测的方法,将特征金字塔网络结构(FPN)与自上而下的路径聚集网络结构(PAN)相结合,达到对20×20、40×40和80×80这三个不同尺度的特征图进行融合以及预测的目的;YOLOv5目标检测算法包括Involution算子、CA注意力模块、改进后的边框回归损失函数和改进后的网络架构;
Involution算子:在传统的卷积操作中,由于感受野的大小限制,特征图无法获取空间上长距离关系,同时,在不同输出通道采用不同的卷积核会产生信息冗余,为此,使用一种可以提高获取特征提取的算子(Involution),该算子在不改变通道数的前提下,给特征图的空间上不同位置飞陪不同的权重,从而避免传统卷积操作的空间无关性,可以更好的对图像进行特征提取;该算子由两个部分组成,第一部分为生成卷积核,计算公式如下:
Hi,j=φ(xi,j)=w1σ(w0xi,j) (1)
式中,xi,j表示特征图位置为(i,j)的特征向量,w0和w1为1×1的卷积,目的是对特征图通道数进行缩放,σ是对特征图进行BN和rule操作;
通过φ变换,可以得到对应通道数的权重值,在进行重新排列,最终可以得到所需大小的卷积核,由于采用分组操作,此时获取的卷积核通道数为G,小于原特征图通道数,故要对其进行组内广播操作,从而最终获取大小为K×K×C的卷积核;
第二部分为计算内卷积,将特征图上xi,j的点扩展到K×K大小,再与卷积核进行multiply-add操作,输出最终结果;
CA注意力模块:为了更好的使模型从大量信息中筛选出少量重要信息,使用一种将位置信息嵌入到通道注意力的坐标注意力机制(Coordinate,CA);
CA注意力模块由两个部分组成,第一部分为坐标信息嵌入,分别对特征图的高度和宽度两个方向进行全局平均池化,如公式(2)、(3)所示:
第二部分为坐标特征图生成,将池化后的特征图进行拼接后,通过1×1的卷积降维,再将得到的特征图进行BN和sigmoid操作后,将特征图分为2个单独的张量,经过sigmoid激活函数得到在宽度和高度上的注意力权重和通过i和j两个参数可以定位到输入图像的相应位置xc(i,j),最终得到输出特征图,如公式(4)所示:
改进后的边框回归损失函数:YOLOv5的损失函数是由三部分组成的,分别是分类损失、定位损失和置信度损失,总损失函数为三者和;在YOLOv5网络结构中,使用CIoU loss作为定位损失,CIoU将目标和边框之间的距离、重叠率、尺度以及惩罚项都考虑进去,使得目标框回归变得更加稳定,如公式(5)所示:
其中:
式中,IoU为预测框与真实框的交并比,ρ(b,bgt)为预测框与真实框的中心点的欧式距离,c为可以同时包含预测框和真实框的最小区域的对角线长度,α为权重系数,目的是使得损失函数向更大的重叠区域方向进行优化,v为横量预测框与真实框的高度和宽度的相似度;
为了提高模型的回归精度,在CIoU的基础上提出了一种新的IoU损失函数,即α-CIoU,如公式(9)所示,α-CIoU在CIoU的基础上引入幂运算,可以自适应的改变CIoU的各项参数大小;
α-CIoU Loss相较于CIoU Loss,可以更好的提高精度;
改进后的网络架构:为了更好的提高特征提取能力,准确的识别火灾,采用带有下采样的Involution算子,为避免下采样导致图片过小而导致信息丢失,只增加一层Involution算子,为了降低卷积操作给第一层拼接操作带来的信息冗余,将该算子放置于第二层Conv后,除此之外,为了可以进一步关注重点信息,在主干网络的第三个C3层后加图注意力机制模块,最终,特征图的检测尺度变为10×10、20×20和40×40这三个不同尺度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王龙兴,未经王龙兴许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210460452.2/1.html,转载请声明来源钻瓜专利网。





