[发明专利]一种基于深度学习的高精度快速单类目标检测方法有效
申请号: | 201711404571.1 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108154199B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 任俊芬 | 申请(专利权)人: | 任俊芬 |
主分类号: | G06V30/194 | 分类号: | G06V30/194;G06N3/04 |
代理公司: | 北京科名专利代理有限公司 11468 | 代理人: | 陈朝阳 |
地址: | 054000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 高精度 快速 类目 检测 方法 | ||
一种基于深度学习的高精度快速单类目标检测方法,包括如下步骤:步骤一)设计神经网络:确定目标物的特性,所述特性包括:目标物是刚体或非刚体,目标物自成一体或作某个更大物体的一部分;确定在应用场景中该目标物的尺寸变化范围,根据目标物的特性和目标物的尺寸变化范围确定不同尺寸下神经元感受野需要覆盖的范围,再设计出特定深度的神经网络结构。步骤二)神经网络的训练:搜集目标场景中包含有目标物体的图像数据并对每幅图像中的目标物进行标注,将标记后的图像数据作为网络学习的目标;执行标准的神经网络训练流程;步骤三)神经网络训练完毕后,将测试的场景图像输入给神经网络,根据神经网络的输出即可定位目标。
技术领域
本发明涉及人工神经网络、计算机视觉等技术领域,具体涉及一种基于深度学习的高精度快速单类目标检测方法。
背景技术
目标检测是计算机视觉领域的基本问题之一,其需要完成的任务是在静态图像中定位多个特定类别的目标(比如人、车、树等)并且使用记号(通常使用紧包目标的矩形框)标明。具体来说,本发明涉及的是单一类别目标检测,即需要定位和标明的目标只有一类。多类别目标检测包含了单类的情况。
在深度学习之前的时代,解决目标检测问题的经典框架是滑动窗口结合人工图像特征分类。例如,人脸检测通常使用LBP(Local Binary Pattern)特征加Adaboost分类器;行人检测通常使用HOG(Histogram of Oriented Gradient)特征加Adaboost分类器。这类传统方法的弊端在于两方面:1)LBP和HOG特征均为人工设计的特征,因此它们在表达能力上都有各自的局限性,从而使得分类准确性难以进一步提高;2)由于采用了滑动窗口的方式,这类方法在检测不同尺寸目标时,需要对原图像进行多次缩放来提高尺寸的覆盖范围,同时针对目标的长宽比需要人为设计窗口大小,从而使得检测步骤繁琐且提速困难。
在深度学习的时代,目标检测问题得到极大的关注,众多有效的方法被提出。按照方法框架的差异可以将这些方法分为两类:1)候选区域选择结合人工神经网络分类;2)直接使用人工神经网络同时完成目标的定位和分类。第一类方法相较于传统的检测,大大减少了需要分类的窗口数量,同时使用了深度神经网络作为分类器,检测精度有了大幅提升。然而,作为两阶段的方法,候选区域选择的好坏会严重影响到检测的精度,而且耗时严重。对于检测任务来说,这样的框架并不是一个端到端的学习。第二类方法利用神经网络同时完成定位和识别的功能,是一种端到端的学习方式。在检测速度上,第二类方法要平均优于第一类方法。然而,现在的第二类方法通过为神经网络高层的神经元预定义若干的锚框作为目标候选区域,同时要矫正锚框的位置,计算量仍然较大,还有进一步提速的空间。
发明内容
为了进一步提升现有目标检测算法的精度和速度,本发明提出了一种基于深度学习的高精度快速单类目标检测方法。该方法根据待检目标的特性和尺寸范围,定制化地设计深度人工神经网络,接着使用包含有该类目标的图像数据训练神经网络,训练完毕后,即可使用该网络对这类目标进行检测。
本发明是通过如下技术方案实现的:
一种基于深度学习的高精度快速单类目标检测方法,包括如下步骤:
步骤一)设计神经网络:确定目标物的特性,所述特性包括:目标物是刚体或非刚体,目标物自成一体或作某个更大物体的一部分;确定在应用场景中该目标物的尺寸变化范围,根据目标物的特性和目标物的尺寸变化范围确定不同尺寸下神经元感受野需要覆盖的范围,再设计出特定深度的神经网络结构。
步骤二)神经网络的训练:搜集目标场景中包含有目标物体的图像数据并对每幅图像中的目标物进行标注,将标记后的图像数据作为网络学习的目标;执行标准的神经网络训练流程;
步骤三)神经网络训练完毕后,将测试的场景图像输入给神经网络,根据神经网络的输出即可定位目标。
进一步地,所述步骤一)中,根据目标物在应用场景中出现的方式和距离,统计得到其尺寸变化的范围,以像素来记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于任俊芬,未经任俊芬许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711404571.1/2.html,转载请声明来源钻瓜专利网。