[发明专利]对视频进行多体深度恢复和分割的方法有效
申请号: | 201010616940.5 | 申请日: | 2010-12-31 |
公开(公告)号: | CN102074020A | 公开(公告)日: | 2011-05-25 |
发明(设计)人: | 鲍虎军;章国锋 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;G06T5/00;H04N13/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈昱彤 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种对视频进行多体深度恢复和分割的方法,包括如下步骤:(1)对视频用迭代方法进行能量最小化,得到视频的每一帧的初始标号,初始标号由像素的深度和分割信息组成;(2)对每一帧进行图像分割后,用多体平面拟合方法对每一帧图像的初始标号进行优化,得到每一帧图像所有分割块的优化后的标号;(3)利用优化后的标号,为每一帧上的每个像素从邻近帧中选出一组可见帧和一组不可见帧;(4)对所述视频的每一帧用迭代方法进行能量最小化,得到视频的每一帧的迭代后的标号,然后用层次置信度传播算法进一步扩展迭代后的标号中深度的级数。本发明可对存在多个刚性物体运动的视频进行深度恢复和分割。 | ||
搜索关键词: | 视频 进行 深度 恢复 分割 方法 | ||
【主权项】:
1.一种对视频进行多体深度恢复和分割的方法,其特征在于,包括如下步骤: (1)利用式(1)的能量方程对视频用迭代方法进行能量最小化,得到视频的每一帧的初始标号,所述初始标号由像素的深度信息和分割信息组成,
(1)其中,
(2)
(3)式(1)、式(2)和式(3)中,It表示第t帧图像,t=1…n,且n为视频的总帧数;xt表示It上的一个像素;
表示xt的标号;N(xt)表示像素xt的所有邻近像素;
,表示邻近像素之间的标号的差值;
表示截断参数;
表示对像素xt可见的帧,且所述对像素xt可见的帧中与xt对应的像素在第t帧的重投影与xt重合;pc表示像素xt和
的颜色相似性;
表示xt的标号;
表示控制式(3)的差分函数形状的参数;
表示第
帧中与像素xt对应的像素,且第
帧是属于
的一帧;
表示像素xt的颜色值;
是像素
的颜色值;
的坐标由利用式(4)得到的
进行齐次坐标到二维坐标的转变得到:
(4)式(4)中, h表示齐次坐标;
表示像素xt的标号中的深度信息;
、
和
分别对应表示第
帧所对应的摄像机的内部参数矩阵、外部参数的旋转矩阵和外部参数的平移矩阵;
、
和
分别是第t帧对应的摄像机的内部参数矩阵、外部参数的旋转矩阵和外部参数的平移矩阵;(2)对每一帧进行图像分割后,用多体平面拟合方法对每一帧图像的所述初始标号进行优化,得到每一帧图像所有分割块的优化后的标号;(3)利用步骤(2)最终所得到的优化后的标号,为第t帧上的每个像素xt从邻近帧中选出一组可见帧
和一组不可见帧
,所述可见帧中的所有像素变换到第t帧都不与xt重合,所述不可见帧中的至少一个像素变换到第t帧会与xt重合;(4)利用式(5)所示的能量方程对所述视频的每一帧用迭代方法进行能量最小化,得到视频的每一帧的迭代后的标号,然后用层次置信度传播算法进一步扩展迭代后的标号中深度的级数,
(5)其中,
(6)
(7)
(8)
(9)
(10)
(11)式(5)至式(11)中,
和
分别表示能量方程中的数据项和平滑项;It表示第t帧图像,t=1…n,且n为视频的总帧数;xt表示It上的一个像素;
表示xt的标号;N(xt)表示像素xt的所有邻近像素;
,表示邻近像素之间的标号的差值;
表示截断参数;
表示第
帧中与像素xt对应的像素;
表示像素xt的颜色值;
是像素
的颜色值;
的坐标由利用式(4)得到的
进行齐次坐标到二维坐标的转变得到;pc表示像素xt和
的颜色相似性;
表示xt的标号;
表示像素
的标号;
和
分别表示标号
和标号
中的分割标号;pg表示衡量两个像素之间几何上的一致性;
和
分别表示标号
和标号
中的的深度标号;
是将像素
根据
重投影到第t帧上的像素;pv表示像素xt和坐标
所对应像素的几何一致性和分割一致性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010616940.5/,转载请声明来源钻瓜专利网。