[发明专利]类地重力场环境下室内场景单目视觉空间识别方法有效

专利信息
申请号: 201410335080.6 申请日: 2014-07-14
公开(公告)号: CN104077611B 公开(公告)日: 2017-06-09
发明(设计)人: 郑李明;崔兵兵 申请(专利权)人: 南京原觉信息科技有限公司
主分类号: G06K9/66 分类号: G06K9/66
代理公司: 南京天华专利代理有限责任公司32218 代理人: 瞿网兰
地址: 211100 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 重力场 环境 室内 场景 目视 空间 识别 方法
【权利要求书】:

1.一种类地重力场环境下室内场景单目视觉空间识别方法,其特征是它包括以下步骤:

首先,对图像进行基于像素色彩及空间位置的超像素图像分割,形成具有一定密度的超像素图像;

其次,基于人类视觉多尺度感知特性的色彩空间谱聚类方法将超像素图像进一步聚类,生成接近人类视觉色彩分类感知的图块图像,以降维超像素图像;

第三,对色彩分类图块进行基于轮廓形态谱聚类,将立面物体的图像聚类成大立面图块;

第四,采用室外重力场视觉模糊分布密度函数进行室内场景的初步空间分类,初步找出可能的天花板、立面及地面的空间区域;

第五,利用曼哈顿强度特性将具有强立面轮廓特征的图块归类成立面;

第六,基于室内场景透视原理对天花板与立面、地面与立面边界进行搜索;

第七,采用室内重力场视觉模糊分布密度函数进行室内场景图像空间识别;

第八,基于地面与天花板透视原理标注室内空间生成深度图;

所述的多尺度感知特性的色彩空间谱聚类方法是先采用简单线性迭代聚类方法即SLIC(Simple Linear Iterative Clustering)进行超像素聚类,它以像素的CIELAB色彩空间的L、a、b值及像素的x,y轴坐标构建5维空间,并定义了规范化的距离Ds,具体定义如下:

其中:Ck=[lk,ak,bk,xk,yk]T为聚类的中心;[li,ai,bi,xi,yi]T为图像像素点的5维空间坐标;N为图像的像素数;K为期望获得的超像素的数目;s为超像素中心栅格间距;Ds为色彩lab距离dlab和dxy基于s的规范化距离;m为可控的超像素密度因子;其次采用以下方法进行多尺度特性色彩空间谱聚类:

(1)将SLIC方法所产生的n个超像素作为无向权值图G的顶点V={v1,v2,…,vn};

(2)构建邻接矩阵,i=1,2…n;j=1,2…n,其中,n为超像素的个数;

(3)构建权值邻接矩阵,i=1,2…n;j=1,2…n;

其中权值W(i,j)为相邻两个超像素之间的规范化CIELAB颜色直方图Bhattacharyya系数进行度量计算,具体构建方法是将图像的色彩空间转换到CIELAB空间,并将L通道的取值范围划分为8级等分,a通道的取值范围划分为16等分,将b通道的取值范围划分成16个等级,其中将L通道取值范围划分为8级的目的是降低色彩亮度变化对权值的扰动,每个超像素在8×16×16=2048维度的空间计算值直方图为:

其中l=2048,则当Ei,j=1时

式中:h1(i)、h2(i)、hl(i)、hu(i)、hu(j)是超像素中像素点在CIELAB标准色彩空间中a通道、b通道、L通道中相应等级中的像素点个数所组成2048维的直方图向量;其中a通道的取值范围划分为16等分,将b通道的取值范围划分成16个等级,其中将L通道取值范围划分为8级;其下标为等级数,i,j为超像素图块的标号;

“W”表述为权值矩阵,其中权值W(i,j)为相邻两个超像素之间的规范化CIELAB颜色直方图Bhattacharyya系数进行度量计算得出;

“Rk”是矩阵论中的规范表达,表述k维实向量;

对于权值W(i,j)的取值通过增加一个基于Bhattacharyya系数的色彩距离的约束条件进行选取,选取条件为:

当W(i,j)≤0.71≈cos 45°时,则令W(i,j)=0;

增加此约束条件的目的是提高相邻超像素间色彩的相似性阈值以提高方法的干扰能力和鲁棒性;

(4)构建度矩阵,i=1,2…n;j=1,2…n;

(5)构建规范化Laplacian矩阵,采用Normalized-cut准则来计算规范化的Laplacian矩阵:Lsym=I-D-1/2WD-1/2 (9)

(6)计算Lsym进行特征值分解,并取前K个最小特征值所对应的特征向量,V1,V2,…,Vk;其中K=[0.1×n],即取n的10%作为图像聚类特征向量的维度,从而实现将超像素图像降维到接近10%以下的目的;

(7)将V1,V2,…,Vk排列组成Rn×k矩阵并将矩阵中的每个元素取绝对值得矩阵U;

(8)对于i=1,2…n,令yi∈Rk为矩阵U的第i行向量;

(9)对非零的yi∈Rk向量进行归一化,并用Bhattacharyya系数法进行聚类,其中Bhattacharyya距离的BU阈值为cos20°≈0.95,即当BU≥0.95时,超像素间进行聚类;

(10)采用以下方法对每个谱聚类图块进行聚类,生成接近人类视觉色彩分类感知的图块图像:

①构建颜色多尺度空间模型:

采用一个以a=0,b=0为圆心,Rm为半径的圆柱体将CIELAB色彩空间分割成两个部分:

对于在ab平面上投影的模长大于Rm的颜色向量,采用两个颜色向量在ab平面投影向量间的夹角和颜色向量在ab平面上投影的模长之差的绝对值作为颜色聚类的近似性测度,具体的数学表达如下:

其中:和为两个颜色向量在ab平面投影向量,θT和ΔmT分别为两向量聚类夹角的阈值和模长之差的阈值,θT的取值范围为θT=5~20°,ΔmT的取值范围为ΔmT=15~40;

对于在ab平面上投影的模长小于Rm的颜色向量,则采用两个颜色向量在ab平面投影向量间的夹角,其表达式同(10)式,以及向量在L上的亮度差作为其颜色聚类的近似性测度,具体的数学表达如下:

ΔL=|La-Lb|≤ΔLT (12)

其中:ΔLT的取值范围为ΔLT=5~20;

②应用颜色多尺度空间模型进行图像聚类:

a.计算每个聚类图块平均色彩向量值,并将向量投影到ab平面上;

b.计算每个聚类图块平均色彩向量值投影在ab平面上向量的模长,并根据向量在ab平面上的模长将其归于不同的测度空间;

c.对相邻图块类采用式(10)进行向量间的夹角的计算;

d.以公式(10)(11)(12)为判据,将符合条件的图块进行聚类;

e.重复a~d步,直到收敛。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京原觉信息科技有限公司,未经南京原觉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410335080.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top