[发明专利]一种轻量级视觉目标检测方法及系统在审
申请号: | 202010760998.0 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111860693A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 凌贺飞;张丽;黄昌喜 | 申请(专利权)人: | 元神科技(杭州)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 武汉华之喻知识产权代理有限公司 42267 | 代理人: | 廖盈春;曹葆青 |
地址: | 311200 浙江省杭州市萧山*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轻量级 视觉 目标 检测 方法 系统 | ||
本发明提供一种轻量级视觉目标检测方法及系统,包括:利用骨干网络初步提取待检测图像中的目标特征;所述骨干网络包括特征提取器;所述特征提取器包括密集块和过渡块,每两个密集块之间是过渡块,所述密集块为双路轻量级密集块,其两个分支共享一个标准卷积和深度卷积以减少计算量,使得所述密集块为轻量级;利用检测头部对所述目标特征标特征进行多层检测,以及使用特征金字塔进行多尺度特征融合,以对不同尺度的目标特征分别进行检测,来确定待检测图像中不同目标的位置和不同目标的类别。本发明具有训练便捷、参数量更少,计算成本低、检测精度高等优点。
技术领域
本发明属于计算机视觉与模式识别领域,更具体地,涉及一种轻量级视觉目标检测方法及系统。
背景技术
目标检测是计算机视觉和数字图像处理的重要分支,广泛应用于智能视频监控、工业检测等诸多领域。目标检测是智能监控系统的核心部分,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。通过目标检测等计算机视觉算法减少繁琐复杂的工作对人力资源的消耗,具有重要的现实意义。随着计算机视觉的发展,近年来目标检测取得了长足的进步,基于深度学习的目标检测技术在计算精度和计算速度上都取得了突破性的进展,并逐步应用于现实生产生活中。随着摄像头等终端设备的智能化发展,越来越多的智能视频分析任务要求能够在终端设备中完成,对于能搭载在监控摄像头等终端设备中的轻量级目标检测模型的需求也日益增大。但现有的目标检测网络存在计算成本高、模型存储大等缺点,大多不能应用于计算能力和存储资源有限的设备。因此,在严格内存和计算预算的条件下实现高效的轻量级目标检测网络成为了国内外科研工作者的研究热点。
传统的目标检测方法包括三个步骤:区域选择、特征提取和分类回归。存在两个致命的问题,一个是区域选择的策略较差并且相当耗时;另一个是手动提取的特征不够鲁棒,对最终的检测效果影响很大。深度学习方法近年来在计算机视觉领域得到了广泛的应用,在图像任务中最常用的是卷积神经网络(Convolutional Neural Network,CNN)。自2012年以来,得益于深度学习理论的发展以及深度学习框架与GPU加速技术的进步,大量基于CNN的目标检测方法被提出,如R-CNN、YOLO、SSD以及它们的一些变体,这极大地提升了目标检测的精度和速度。
目前主流的基于深度学习的目标检测方法可以被分为两种主要类别:一种是以R-CNN为代表的基于区域提案方法,另一种是以YOLO和SSD为代表的将目标检测问题转换为回归问题的无区域提案方法。尽管这些网络已经达到了很高的检测精确度,但是由于高计算复杂度和大量参数,他们中的大多数都需要大量硬件资源来支持使用。一些工作对速度和准确性之间的权衡进行了广泛的研究,但资源限制(包括计算限制和内存限制)却很少受到关注。由于资源短缺,智能芯片和手机等一些终端设备很难存储和运行较大的深度学习模型。因此,大多数当前的目标检测解决方案都不适合此场景。
最近,很多工作致力于设计一种轻量级目标检测网络来缓解上述限制。例如,TinySSD—SSD的一个简化版本,将SSD的模型参数压缩到2.3M,在PASCAL VOC 2007test数据集上检测精度能达到61.3%。YOLOv3也提供了一个轻量级的版本叫YOLOv3-tiny,它成功将YOLOv3的模型参数压缩到低于10M。还有一些基于轻量级分类网络的检测框架也大大减少了网络的内存占用和计算量。例如,MobileNet-SSD在PASCALVOC 2007test数据集上的模型仅仅需要5.5M的参数和1.14B的计算量。虽然这些网络在一定程度上减少了计算和存储资源,但是由于参数数量的急剧减少,它们也削弱了特征的表达能力,最终检测精度也必然降低。例如,在PASCALVOC2007test数据集中,MobileNet-SSD的检测精度(68%)比SSD(77.2%)低9.2%。
综上所述,现有的轻量级目标检测网络由于其高计算量与高参数量在资源需求有限的情况下仍然不能达到令人满意的性能。因此,如何利用较少的参数和较小的计算量来提取更适合于目标检测任务的特征,以维持较高的检测精度尤其是小目标的检测精度是当前轻量级视觉目标检测任务亟待解决的重要问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于元神科技(杭州)有限公司,未经元神科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010760998.0/2.html,转载请声明来源钻瓜专利网。