[发明专利]基于深度图像的对象检测方法及其实现装置有效

专利信息
申请号: 201210143962.3 申请日: 2012-05-10
公开(公告)号: CN103390164B 公开(公告)日: 2017-03-29
发明(设计)人: 刘亚洲;孙权森 申请(专利权)人: 南京理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06T7/00
代理公司: 南京理工大学专利中心32203 代理人: 朱显国
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 图像 对象 检测 方法 及其 实现 装置
【说明书】:

技术领域

发明涉及模式识别和人机交互领域,更具体地说,涉及一种基于深度图像的对象检测方法及其实现装置。

背景技术

    基于图像的物体检测是指在一幅给定图像中确定是否存在某一类或者几类特定的物体,并且给出该物体在图像中的具体的位置的过程。在模式识别和人机交互领域,常见的被检测的物体包括:车辆、人体、人脸、手等。通过确定这些对象的大小、位置、以及运动等信息,计算机可以实现对于特定的视觉目标或者人的行为进行响应,最终实现人机交互或者计算机自动处理识别的目的。

    物体检测过程中包括两个关键步骤:特征选择和分类器的学习。特征选择需要解决的问题是:对于当前对象而言,哪些信息具有更强的描述能力。特征选择是否恰当,直接决定了物体检测的成功与否。例如:在人脸检测领域,Paul Viola和Michael Jones将灰度差异特征(Haar)应用于快速鲁棒的人脸检测,并且获得的巨大的成功;在人体检测领域,Navneet Dalal和Bill Triggs利用梯度方向直方图(HOG)特征进行人体描述,实现了较高性能的人体检测。分类器学习所解决的问题是:在已确定的特征的基础上,找到一系列规则,用这些规则来判定当前图像区域是否为包含物体的区域。确定规则的过程称为(机器)学习的过程。在物体检测领域,目前经常采用的分类器包括支持向量机(SVM)方法和基于Adaboost的方法。

物体检测的输入图像通常为彩色图像或者灰度图像。为了实现对于不同大小的物体的检测,常采用的策略为对于输入图像在多个尺度上进行放缩,形成一个图像金字塔,然后在图像金字塔的所有层上利用扫描窗口进行判定。最后再将所有层上的判定结果映射回到输入图像的标准尺寸上进行融合,从而实现对不同大小的物体进行检测。然而,这种基于灰度或者彩色图像的检测方法存在以下不足:其一,易受光照变化的影响,当光照变化较大时,物体的外观会发生较大的变化,而在光照较弱的环境下,某些外观特征也会变得不可辨识;其二,易受到复杂的背景的影响,当背景纹理很丰富时,极易产生与物体相似的外观模式,产生误检;其三,需要对于图像的所有尺度的所有位置进行检测,扫描窗口的数量过多,当采用计算量较大的特征时,系统的实时性没有保证。

四、发明内容

本发明的目的在于针对上述物体检测技术中,检测窗口数量过多,限制了计算量较大的复杂特征的应用的问题,提出了一种基于深度图像的对象检测方法及其实现装置。

实现本发明目的的技术解决方案为:

本发明基于深度图像的对象检测方法,包括训练过程和检测过程,

训练过程的步骤如下:

a1)从相机中读取图像作为数据源;

a2)根据待检测物体距离相机的距离,在图像上对物体进行分割;

a3)在分割的基础上计算物体的外观和形状特征;

a4)根据计算出的物体的外观和形状特征训练针对于物体的分类器;

检测过程的步骤如下:

b1)从相机中读取图像作为数据源;

b2)根据物体距离相机的距离对其图像进行不同尺度的缩放,形成一个图像金字塔;

b3)对于图像金字塔的每一层的图像上的非空区域,划分为多个扫描窗口;

b4)在每一个扫描窗口内部,计算物体的外观和形状特征;

b5)利用训练过程中得到的分类器,对扫描窗口内的外观和形状特征进行判定,决定扫描窗口内是否包含目标物体;

b6)将图像金字塔每一层的检测结果进行融合,得到最终的检测结果。

本发明基于深度图像的对象检测方法,所述步骤a1)和步骤b1)中的数据源可以只包含深度图像,也可以同时包含可见光图像;深度图像是物体距离相机的距离;该深度图像通过双目视觉设备或通过红外结构光投影设备得到。

本发明基于深度图像的对象检测方法,所述步骤a2)如下:

a21)在深度图像上标记目标物体的包围框;对深度图像和可见光图像进行配准,利用变化矩阵将一个图像上的标注结果映射到另一个图像上;

a22)从包围框的中心开始,得到物体在包围框内部的联通区域;假设同一个物体在深度上是连续的,在深度图像上已经标注的物体包围框内,采用连续区域分析connected component analysis方法将物体进行分割,每个包围框被分割成两部分:物体区域和背景区域;

a23)如果输入信息除了深度图像还包括可见光图像,在配准的基础上将步骤12)中的分割结果映射到可见光图像上。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210143962.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top