[发明专利]用于消防通道占用目标检测的目标检测模型、方法及应用有效
申请号: | 202210432925.8 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114529825B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 沈瑶;张香伟;毛云青;曹喆;梁艺蕾 | 申请(专利权)人: | 城云科技(中国)有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/20;G06V10/22;G06V10/46;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州汇和信专利代理有限公司 33475 | 代理人: | 薛文玲 |
地址: | 310052 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 消防 通道 占用 目标 检测 模型 方法 应用 | ||
本申请提出了一种用于消防通道占用目标检测的目标检测模型、方法及应用,涉及目标检测领域,框架由三部分组成:主干网络,颈部多尺度特征融合网络和神经网络头部;主干网络包含五次降采样通过独立的切片操作、四个转置瓶颈残差模块和一个3*3卷积;颈部多尺度特征融合网络,使用1*1卷积进行特征融合和特征通道统一化,随后是一个跳跃层和交叉层提炼和融合的高层语义信息和低层空间特征的融合,最后是一个上下文感知的注意力网络;神经网络头部,分为分类预测网络和边框预测网络,可很好地检测到多尺度目标,可被应用到消防通道的占有目标检测中。
技术领域
本申请涉及目标检测领域,特别是涉及用于消防通道占用目标检测的目标检测模型、方法及应用。
背景技术
近十年来以深度学习取得了巨大的进步和影响力,主要的驱动力是神经网络的复兴,尤其是卷积神经网络(ConvNets);在过去的十年里,计算机视觉识别领域成功地从设计特征提取器转移到设计神经网络架构,与此同时自然语言处理(NLP)的神经网络设计走了一条非常不同的道路,Transformer模型取代了RNN成为主导的主干架构。
传统卷积网络通常采用从上到下的单行结构;对于大物体而言,其语义信息将出现在较深的特征图中;而对于小物体,其语义信息出现在较浅的特征图中,随着网络的加深,其细节信息可能会完全消失。而特别是在目标检测的场景中,模型需要对不同尺度的物体都能检测出来,这要求模型对于尺度要具有鲁棒性。在多尺度的物体中,大尺度的物体由于面积大、特征丰富,通常来讲较为容易检测;难度较大的主要是小尺度的物体,而这部分小物体在实际工程中却占据了较大的比例。通常认为绝对尺寸小于32×32的物体,可以视为小物体或者物体宽高是原图宽高的1/10以下,可以视为小物体;小物体由于其尺寸较小,可利用的特征有限,这使得其检测较为困难。
当前的检测算法对于小物体并不友好,体现在以下4个方面:1、过大的下采样率:假设当前小物体尺寸为15×15,一般的物体检测中卷积下采样率为16,这样导致在特征图上过大的下采样率使得小物体连一个像素点都占据不到;2、过大的感受野:在卷积网络中,特征图上特征点的感受野比下采样率大很多,导致在特征图上的一个点中,小物体占据的特征更少,会包含大量周围区域的特征,从而影响其检测结果;3、语义与空间的矛盾:当前检测算法,如Faster RCNN,其Backbone大都是自上到下的方式,深层与浅层特征图在语义性与空间性上没有做到更好的均衡;4、SSD一阶算法缺乏特征融合:SSD虽然使用了多层特征图,但浅层的特征图语义信息不足,没有进行特征的融合,致使小物体检测的结果较差。
总结而言,目前的卷积神经网络在实际设计和使用中仍面临许多问题,主要体现在以下几个方面:
(1)对于大物体而言,其语义信息将出现在较深的特征图中;而对于小物体,其语义信息出现在较浅的特征图中,随着网络的加深,其细节信息可能会完全消失;而目标检测中,模型需要对不同尺度的物体都能检测出来,这要求模型对于尺度要具有鲁棒性。
尽管目标检测网络在架构设计、训练策略等方面变得越加强大,但检测对于大尺度变化的目标并没有改变。近期的研究仍然依赖于优越的主干设计,但这会使得高级特征与低级特征之间的信息交换不足。
(2)大多数优秀的细粒度图像识别方法通过发掘目标的局部特征来辅助识别,却没有对局部信息进行标注,而是采取弱监督或无监督的方式来定位局部特征位置。而且大部分的方法采用预训练的检测器,无法很好地捕捉目标与局部特征的关系。
发明内容
本申请实施例提供了一种用于消防通道占用目标检测的目标检测模型、方法及应用,可提高小目标检测精度,特别适用于消防通道占用目标检测的特定应用场景。
第一方面,本申请实施例提供了一种目标检测模型的构建方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于城云科技(中国)有限公司,未经城云科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210432925.8/2.html,转载请声明来源钻瓜专利网。