[发明专利]一种基于多层次图结构的交互式立体图像快速分割方法有效

申请号：	201510354774.9	申请日：	2015-06-24
公开（公告）号：	CN105046689B	公开（公告）日：	2017-12-15
发明（设计）人：	马伟;邱晓慧;杨璐维;邓米克;张明亮;段立娟	申请（专利权）人：	北京工业大学
主分类号：	G06T7/143	分类号：	G06T7/143;G06T7/194
代理公司：	北京思海天达知识产权代理有限公司11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于多层次图结构的交互式立体图像快速分割方法，首先输入一组立体图像，通过立体图像匹配算法得到视差图。在原始图像左右任意一图中指定部分前、背景。根据指定部分应用CUDA并行计算的方法建立前、背景的颜色以及视差分布的先验统计模型。通过对原始图像进行高斯滤波、下采样得到粗糙尺度较小的图像，然后将粗糙图像与原始图像一起构成多层次图结构。鉴于目前立体图像分割存在分割模型复杂，计算效率低的问题。本发明在基于视差图的立体图像同步分割的理论框架下，探索新的分割方法。力图简化模型的复杂度，并行处理计算密集型的任务，提高立体图像分割速度，实现实时分割常见尺寸立体图像的目的。
搜索关键词：	一种基于多层次结构交互式立体图像快速分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于多层次图结构的交互式立体图像快速分割方法，其特征在于：该方法首先输入一组立体图像，通过立体图像匹配算法得到视差图；在原始图像左右任意一图中指定部分前、背景；根据指定部分应用CUDA并行计算的方法建立前、背景的颜色以及视差分布的先验统计模型；通过对原始图像进行高斯滤波、下采样得到粗糙尺度较小的图像，然后将粗糙图像与原始图像一起构成多层次图结构；以此为基础，在图割理论框架下形式化多层次图结构中的颜色、梯度以及视差约束，构造能量函数；为了提高效率，应用CUDA并行计算的方法处理建图过程；采用图的最大流/最小割算法求解多层次图的全局最优化结果；然后统计边界处误差较大的像素点，采用传统的图割理论，对统计的边界像素点进行局部优化；将全局处理与局部优化的结果融合在一起，构成最后的分割结果；若用户没有得到理想的效果，继续对图中错误区域进行勾画，直到得到理想结果；其特征在于：该方法具体包括如下步骤：步骤一，匹配立体图像；读入一对立体图像I＝{Il，Ir}，Il与Ir分别表示左、右图像；通过立体匹配算法计算得到左、右图像对应的视差图，分别用Dl与Dr表示；步骤二，添加前、背景线索；用户通过所设计的界面在其中任意一张图像中指定部分前、背景；利用鼠标、触摸屏或者手写笔输入设备，通过在图像上勾画不同颜色的线条指定部分前、背景像素；第一线条覆盖的像素属于前景，第二线条覆盖的像素属于背景；本方法的后续步骤对于该步骤中所用的前、背景像素指定方式并无限制，其它方式亦可使用；步骤三，建立前、背景的颜色、视差先验模型；用F表示用户指定的前景像素集合，B表示用户指定的背景像素集合；前、背景的颜色、视差的先验模型采用GMM、直方图以及多个类簇的形式表达；本方法采用的是多类簇形式，通过统计对应像素集合的颜色、视差得到类簇；为了提高处理速度，采用基于CUDA并行的Kmeans算法，对F与B中的像素对应的颜色值、视差值分别进行聚类；处理颜色模型的具体过程如下：每个线程处理一个像素，计算每个像素到所有前景、背景类簇的距离，选择最近的距离，将像素聚类到对应的类簇中；得到Nc个前景颜色类簇Mc个背景颜色类簇上述颜色类簇分别表示前景、背景的颜色分布统计模型；同时，用同样的方法，对F和B中的像素对应的视差值分别进行聚类，得到Nd个前景视差类簇Md个背景视差类簇上述视差类簇分别表示前景、背景的视差分布统计模型；在本实施例中，Nc＝Mc＝64；Nd＝Md＝16；步骤四，基于多层次图结构的全局优化；由于图像中前景、背景各自的分布比较聚集即前、背景内部像素差异较小，边界处像素差异较大；利用这一特性，用区域具有代表性的像素来表示邻域所有像素；本方法采用高斯滤波、下采样的方式，得到代表性的像素点；进而得到粗糙的尺度较小的图像；将粗糙图像与原始图像融合，构成多层次图结构；对多层次图结构的模型进行全局处理；将原始立体图像对表示为I＝{Il，Ir}，粗糙的立体图像对表示为Iτ＝{Il,τ,Ir,τ}，Il、Il,τ与Ir、Ir,τ分别表示左、右图像；将原始立体图像与粗糙立体图像共同表示成一个无向图G＝<ν,ε>；其中，ν为无向图G中的节点集合，ε为边的集合；无向图G中的每个顶点对应立体图像I与Iτ中的一个像素；交互式立体图像快速分割是在输入笔画的约束下，为原始立体图像对中的每个像素pi赋予一个标签xi；xi∈{1，0}，分别表示前、背景；无向图G中的边包含每个像素与源点、汇点的连接边，图像内相邻像素的连接边，以及视差图决定的立体图像对应点之间的连接边；同时还包含粗糙层与原始图像的父子节点之间的连接边；令为粗糙层图像像素点；由于粗糙层是对原始层进行下采样得到的，所以一个代表采样前的I图像中Nl*Nl的区域内的像素，在本实施例中Nl＝3；把求解上述基于多层次图结构的立体图像快速分割问题定义为以下目标能量函数的最优化问题：E(X)=wunaryΣpiτ∈IτEunary(piτ)+wintraΣ(piτ,pjτ)∈NintraEintra(piτ,pjτ)+Σ(pil,τ,pir,τ)∈NintraEintra(pil,τ,pir,τ)+wpaternityΣ(piτ,pi,j)∈NpaternityEpaternity(piτ,pi,j)---(1)]]>其中是一元项，表示粗糙层像素的颜色、视差与前、背景颜色和视差统计模型的相似性，也叫做数据项；相似性越高，值越大；是粗糙层图像内二元项，反映了粗糙层图像所有像素与四邻域之间的差异，Nintra表示包含左右粗糙层图中所有像素点的邻接关系的集合；差异越大，则越小；根据图割算法的原理，此时邻域像素之间倾向于取不同的标签；是粗糙图像间的二元项，定义了对应点的匹配的结果，匹配度越高，则该项越大；Ninter表示含有左右粗糙层像素点对应关系的集合；是粗糙层图像与原始图像间的二元约束关系，表示父子节点的相似性，父子节点差异越小，该值越大，边界经过两者的可能性越小；Npaternity表示父子对应关系的集合；wunary，wintra，winter，wpaternity调节各能量项之间的权值；在本方法中wunary＝1，wintra＝4000，winter＝8000，wpaternity＝1000000；(1)定义一元约束项一元约束项包括颜色一元项和视差一元项两部分，定义如下：Eunary(piτ)=wc(1-Pc(xiτ|ciτ))+wd(1-Pd(xiτ|diτ))---(2)]]>其中，表示给定像素的颜色取前景或背景标签的概率值；因为概率越大，能量函数应当越小，所以取1‑Pc表示颜色一元项；同样地，表示给定像素的视差值取前景或背景标签的概率值；取1‑Pd表示视差一元项；wc、wd分别代表颜色与视差的影响权值，wc+wd＝1；本方法以类簇形式表示前、背景的颜色和视差模型，包括Nc个前景颜色类簇Mc个背景颜色类簇Nd个前景视差类簇Md个背景视差类簇给出一元项的计算方法；颜色一元项的计算方式如下：本方法采用基于CUDA并行方法来计算；将CPU端的所有像素的颜色值传到GPU端；在GPU中，并行处理所有像素；每个线程表示一个未标记像素；线程相互独立，所有线程同时计算像素颜色到前景、背景颜色模型的类簇中心的距离，找到其中最小的距离；用这个最小的距离描述像素颜色与前、背景颜色的相似度；离前景或背景颜色距离越小，则颜色越相近，根据图割理论，该像素越倾向于选择前景或背景标签；待所有线程结束，将GPU端每个像素的求解结果传到CPU端，在CPU端进行详细的建图过程；颜色一元项的数学形式描述为：1-Pc(xiτ|ciτ)=siminsimin+timin,x=0timinsimin+timin,x=0---(3)]]>其中，分别表示像素的颜色到前景和背景颜色的各类簇中心的最小距离，其表达式分别为：simin=min(||ciτ-CnF||2),n=1,...,Nc]]>timin=min(||ciτ-CmB||2),m=1,...,Mc]]>视差一元项与颜色一元项的计算过程相同；(2)定义图像内二元约束项图像内二元约束项包含两项，分别描述像素点周围颜色变化和视差变化，即颜色梯度和视差梯度，定义如下：Eintra(piτ,pjτ)=fc(piτ,pjτ)fd(piτ,pjτ)|xiτ-xjτ|---(4)]]>其中，表示相邻像素间颜色的相似性，颜色越相近其值越大，根据图割算法的原理，边界穿过二者的几率就较小；表示像素相对于邻接像素点视差的相似性；二者视差越相近，其值越大，根据图割算法的原理，二者取不同标签的几率就较小；为了减少视差产生的误差，视差项中的视差，本步骤采用的是经过高斯滤波以及下采样得到的粗糙层的视差信息；两项的定义形式如下：fc(piτ,pjτ)=1||ciτ-cjτ||2+1,(piτ,pjτ)∈Nintra---(5)]]>fd(piτ,pjτ)=1||diτ-djτ||2+1,(piτ,pjτ)∈Nintra---(6)]]>(3)定义图像间二元约束项图像间二元项约束图像间对应像素取相同标签，定义如下：Einter(pil,τ,pir,τ)=C(pil,τ,pir,τ)+C(pir,τ,pil,τ)2|xil,τ-xjr,τ|---(7)]]>其中，C表示立体图像中之间作为对应点的可能性，是非对称函数：C(pil,τ,pir,τ)=P(xil,τ|M(pil,τ)=pjr,τ,xjr,τ)P(M(pil,τ)=pjr,τ)---(8)]]>是基于视差图确定的之间作为对应点的概率分布函数；函数表示是左粗糙层像素在右粗糙层上的对应点，对应关系根据原始视差图决定；采用一致的Delta函数，定义方式如下；P(M(pil,τ)=pjr,τ)=1,|pil,τ-pjr,τ|=diland|pjr,τ-pil,τ|=djr0,others---(9)]]>其中，为左粗糙层中像素与右图中对应点的视差值；为右粗糙层中像素与左图对应点的视差；为了更好的确定左右图像素的对应关系，在此采用的是未经处理的原始视差图的视差；式(8)中表示与之间的颜色相似的概率，在视差完全准确的情况下，但目前的视差计算方法存在误差，为了更好的确定左右图的对应关系，摒弃了视差项；仅利用颜色项，采取如下形式：P(xil,τ|M(pil,τ)=pjr,τ,xjr,τ)=1||cil,τ-cjr,τ||2+1---(10)]]>其中，为左粗糙层图像素的颜色值，是在右粗糙层对应点的值；(4)定义上下层间的父子约束关系图像分割最终的结果应在像素层中表示出来；为了将粗糙层的处理结果传递到像素层，同时保持上下层图像间的父子像素的一致性，将上下层间的父子约束关系定义为：Epaternity(piτ,pi,j)=∞,(piτ,pi,j)∈Npaternity---(11)]]>表示上下层父子像素间的相似性；由于粗糙层的像素代表原始像素层Nl*Nl区域的所有像素，粗糙层像素的标签即代表像素层对应区域的所有像素标签，因此将父子像素间的边权定义为无穷大；非父子节点像素的边不再考虑；(5)求解能量函数最小值对于上下层间的父子约束关系，本方法中定义为无穷大，因此父子之间的边永不会被分割，父节点的标签会直接传递到子节点；由于计算父子节点的边会消耗大量的内存，同时增加计算的时间；在具体优化求解过程中，不再详细计算父子节点间的边；采用图割算法，通过最优化本方法所定义的能量函数(式(1))，得到最优的标记结果，即粗糙层分割结果；然后根据粗糙层像素的标签，直接确定像素层对应的区域像素标签；通过这种方法在准确率不变的情况下，可以显著提高分割的速度；由于直接将粗糙层的标签传递到像素层，对于边界处邻域像素差异较大的像素点存在较大的误差；为了提高分割的准确率，统计边界处误差较大的点，进行局部优化；步骤五，基于原始图像的边界处局部优化经过步骤四的全局优化，得到粗糙的分割边界；由于粗糙层像素对应原始像素层的Nl*Nl区域内像素的集合，将的标签直接传递到像素层Nl*Nl的区域；对于边界处，邻域像素的差异大，直接把粗糙层像素的标签赋给区域的所有像素，会存在较大的误差；因此，对边界处进行单独的局部优化；进行局部优化前，先统计局部边界信息；首先将得到的粗糙的分割边界分为上、下边界与左、右的边界两部分；然后将上、下边界向边界线的上面与下面分别扩充Nl个像素，将左、右边界分别向边界线的左面与右面扩充Nl个像素；在本发明中Nl＝3；对统计的边界像素，采用传统图割理论进行局部优化；局部优化是在像素层上进行的，由于视差计算存在误差，在局部优化时放弃了视差信息；在全局处理时，保证了立体图像分割的一致性，而且局部优化是对局部像素点进行的处理；因此，在局部优化时，同时在左右两幅图像上独立进行；若Ie为统计的局部待处理图；定义局部的能量函数为：Ee(X)=wunaryΣpi∈IeEunarye(pi)+wintraΣ(pi,pj)∈NintraeEintrae(pi,pj)---(12)]]>是一元项即数据项，表示边界处的像素与前、背景颜色模型的相似性，相似性越大，值越大；是二元项即平滑项，表示邻域像素的相似性，二者越相似，值越小；边界经过二者的可能性就越小；代表边界图中所有邻接关系的结合；一元项具体定义如下：Eunarye(pi)=P(xi|ci)=P(ci|xi)P(ci|xi=1)+P(ci|xi=0)---(13)]]>边界处的优化是局部的精确的优化，应尽可能减少误差，因此，一元项仅采用颜色项；一元项的具体计算同全局优化中一元项颜色的计算；二元项为了减少误差，也仅采用颜色项；具体定义如下所示：Eintrae(pi,pj)=1||ci-cj||2+1|xi-xj|,(pi,pj)∈Nintrae---(14)]]>局部能量函数定义好后，采用步骤四提到的最大流/最小割优化算法，最优化局部能量函数即式(12)，得到最优的标记结果，即分割结果；同步骤四分割的结果相融合，构成整个图像对的分割结果；步骤六，交互如对分割结果不满意，返回步骤二，继续添加前、背景线索；每添加一笔，将触发一次完整的分割过程；在已分割的基础上，进行进一步的分割，直到得到满意的结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510354774.9/，转载请声明来源钻瓜专利网。

上一篇：一种简单实用的眼部超声检查隔离膜
下一篇：一种参数自适应调节的高斯混合模型目标检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多层次图结构的交互式立体图像快速分割方法有效

专利文献下载