[发明专利]基于Kinect的感兴趣区域检测方法在审
申请号: | 201410166147.8 | 申请日: | 2014-04-24 |
公开(公告)号: | CN103971116A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 彭先霖;夏召强;冯晓毅;彭进业;王珺;毛晓菲;崔明辉;胡旭涛 | 申请(专利权)人: | 西北工业大学;西安云望电子科技有限公司 |
主分类号: | G06K9/60 | 分类号: | G06K9/60 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 kinect 感兴趣 区域 检测 方法 | ||
1.一种基于Kinect的感兴趣区域检测方法,其特征在于包括以下步骤:
步骤一、利用Kinect3D摄像头和微软提供的应用程序接口,获取RGB-D格式的3D图像;
步骤二、多尺度特征图的计算;包括多尺度图像的生成、灰度特征图的提取、颜色特征图的提取、方向特征图的提取和边缘特征图的提取;
多尺度图像的生成:对二维RGB图像中的R、G和B三个通道,在水平方向与垂直方向上分别进行隔行采样,依此形成多尺度R通道图MR(σ)、多尺度G通道图MG(σ)和多尺度B通道图MB(σ),σ为尺度水平;
灰度特征图提取:由某尺度上图像的三个颜色通道的平均值来表征图像在该尺度的灰度特征图:
颜色特征图提取:在某个尺度图像上的颜色特征采用红绿颜色变化值(RG)和蓝黄颜色变化(BY)度量:
其中,max算子表示图像三个通道中的最大值,min算子表示图像三个通道中的最小值;
方向特征图提取:对某个尺度上的灰度特征图进行Gabor滤波,在此基础上得到该尺度图像在不同方向上的纹理:
其中,“*”表示卷积运算,G(θ)为Gabor算子,(x,y)表示图像像素的空间坐标,θ表示不同滤波方向的参数,ψ为相位,γ为适应比率,λ为波长;
边缘特征提取:对某个尺度上的灰度特征图,用DOG算子检测梯度方向上的变化,以此表示该尺度上的边缘特征图:
Feg(σ)=I(σ)*DOG(v1,v2)
其中,v1、v2是决定DOG响应曲线坡度的方差,取值越小,则波形变化越剧烈;
步骤三、将不同的视觉特征进行归一化并生成二维特征图,然后将视觉特征图与深度图进行融合得到显著图;
视觉特征归一化:在融合特征图与深度图之前,将各个特征归一化到范围(a,b):
其中,符号“←”表示替换运算;
二维视觉特征图的生成:
其中,c1为精细尺度,c2为粗糙尺度;不同的Ut表示灰度、颜色、方向与边缘特征在不同尺度上的差异;
深度图的生成:通过Kinect得到的深度信息是空间各点到摄像头所在平面的距离,物理单位为毫米,采用如下方式进行归一化得深度图:
D(x,y)=Dk(x,y)×255/4095(7)
其中,Dk是从Kinect获取的深度信息;
显著图由二维视觉特征图Ut与深度图D采用线性相加的方式融合得到:
步骤四、首先在显著图S中找到全局最大值的空间位置(xm,ym),并利用胜者全取策略得到初步的感兴趣区域:
其中,τ是阈值,取值在[0,1]之间;为了防止同一前景目标被分为多个较小的感兴趣区域,对上述感兴趣区域作膨胀运算:
Βd(x,y)=Β(x,y)⊕Bdil,Bdil为结构元素(10)
其中,“⊕”表示图像形态学运算中的膨胀运算;
在Bd(x,y)中取值为1的区域为最终的感兴趣区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;西安云望电子科技有限公司,未经西北工业大学;西安云望电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410166147.8/1.html,转载请声明来源钻瓜专利网。