[发明专利]目标检测方法及装置在审
申请号: | 201611118373.4 | 申请日: | 2016-12-07 |
公开(公告)号: | CN108171103A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 冯昊;汪彪;张超;徐静涛;钱德恒;韩在濬;崔昌圭 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁;宋海斌 |
地址: | 100028 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 候选区域 分类 分类结果 目标检测 目标区域 并列 神经网络分类 待检测图像 存储空间 分类模型 计算性能 检测图像 硬件配置 前一级 级联 占用 应用 | ||
本发明实施例提供了目标检测方法及装置,所述方法包括:获取待检测图像;根据级联神经网络对待检测图像的多个候选区域进行分类;其中,从第二级开始的神经网络中,至少存在一级神经网络包含并列的多个该级子神经网络,上述子神经网络对前一级神经网络分类后的分类结果进行分类;根据多个候选区域的最终分类结果,确定出目标区域。本发明实施例中,从第二级开始的神经网络中,至少存在一级神经网络包含并列的多个该级子神经网络,可较为全面精确地对候选区域进行分类,提升分类精度;进而更加精确地确定出目标区域。且有利于减少神经网络的级数,可减少由各级神经网络组成的分类模型占用的存储空间;可应用到硬件配置较低或计算性能较弱的设备中。
技术领域
本发明涉及计算机视觉技术领域,具体而言,本发明涉及一种目标检测方法及装置。
背景技术
目标检测是计算机视觉领域传统研究方向。
传统的目标检测方法,例如Adaboost(自适应提升分类器提升)算法结合Haar(哈尔小波)特征或LBP(Local Binary Pattern,局部二元模式)等特征的方法已得到广泛应用。然而,这类传统方法在检测率等性能上已经很难进一步提升。
目前,目标检测算法的主要挑战在于,目标容易受到干扰导致检测率等性能难以提升。例如,目标中的人脸,容易受人脸的姿态、肤色、光照、遮挡、模糊以及其他外界因素的影响造成的多样性;利用传统的目标检测方法检测人脸时,检测率等性能较低。
近年来,出现了基于深度学习的目标检测方法,这些方法在检测率和错误率上具有较大优势。然而,基于深度学习的目标检测方法存在速度慢、分类模型大两方面问题。具体地,一方面,通过深度学习获得的目标分类模型占用的存储空间较大;例如,普遍采用的ZF(ZeilerandFergus,蔡勒和费格斯)分类模型的典型数据量达到200MB(MegaBytes,兆字节),而VGG(Visual Geometric Group at oxford university,牛津大学视觉几何组)分类模型的典型数据量高达500MB。占用了大量的非易失性存储器(例如硬盘或闪存)的存储空间,同时在分类模型运行时占用较大的内存空间。另一方面,庞大的分类模型数据量导致计算速度和载入速度十分缓慢、并且需要占用大量的处理器资源。这大大限制了基于深度学习的目标检测方法,在硬件配置不高或计算性能较低的设备中的应用。此外,运行基于深度学习的目标检测方法,通常还需要GPU的支持,进一步导致了这类方法难以在性能有限的设备中使用。
为了改进基于深度学习的目标检测方法存在的分类模型较大的问题。出现了一种目标检测方法,该方法中将级联分类器(Cascade Classifier)与深度学习模型,例如CNN(Convolutional Neural Network,卷积神经网络)相结合,称为Cascade(级联)CNN。该方法使用了三组共六级卷积神经网络相级联的结构,每组包括两级卷积神经网络,每一级都使用小型的CNN作为分类模型。每组中在先一级的卷积神经网络对待检测图像中的候选区域或前一组的分类结果,进行目标候选区域与非目标候选区域的分类;该组中在后一级的卷积神经网络对在先一级分类后的候选区域进行校正,得到该组的分类结果。
然而,基于CascadeCNN的目标检测方法,一方面,基于CascadeCNN的目标检测方法采用了多达六级的卷积神经网络作为分类模型,整体上分类模型占用的存储空间依然较大,整体的计算速度也较慢。另一方面,由于每级CNN都是小型CNN,小型CNN能够容纳的数据量较小,以目标中的人脸为例,数据量较小的CNN无法较为精确地表达诸如人脸姿态、肤色和光照条件等复杂情况的属性信息,导致该目标检测方法的检测率性能相较于Adaboost算法等传统方法几乎没有提升。
综上,现有的目标检测方法存在检测率较低或分类模型占用的存储空间较大的缺陷。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611118373.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视觉的零件快速识别方法
- 下一篇:一种文字检测方法及装置