[发明专利]一种利用深度信息的多通道视频流编码方法有效
申请号: | 200810062864.0 | 申请日: | 2008-07-07 |
公开(公告)号: | CN101309411A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | 骆凯;李东晓;张明;何赛军;石冰;冯雅美;谢贤海;朱梦尧 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50;H04N13/00 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 深度 信息 通道 视频 编码 方法 | ||
技术领域
本发明涉及运动图像处理技术,尤其涉及一种利用深度信息的多通道视频流的编码方法。
背景技术
电视系统经历了从黑白到彩色,从模拟到数字的演化。发展至今的二维电视系统提供给观众的仍然是单个视角、平面的影像,用户不能够根据自己的需要从感兴趣的角度观看影像,而且平面的影像有悖于用户的自然三维视觉体验。
作为音视频技术的发展方向,交互式自由视点电视能够提供给用户多个通道的视频流,用户可以根据需要选择一个或者多个通道的视频流作为观看角度,或者通过视点(通道)之间的内插产生更多虚拟视点(通道)视频流,体验到平滑的观看场景角度变化效果;三维(立体)电视在提供给用户多个通道视频流的基础上,通过显示设备的支持,包括立体眼镜、自由立体显示器等等,使用户在观看时感受到场景的深度,体验到接近自然视觉的三维效果。交互式自由视点电视和三维电视的结合将在更多领域产生广阔的应用前景,例如游戏娱乐、教育训练、虚拟现实等等。
交互式自由视点电视和三维电视系统可以分为内容获取、编码压缩、传输、解码、显示五个主要的功能级,同目前的数字电视系统相比,上述系统对各个功能级的资源消耗、功能要求都大为增加,一个主要的特点是上述两个电视系统都需要高效率地编码压缩多个通道的视频流。
多通道视频流存在着数据量巨大的特点,由此造成编解码功能级具有很高的计算复杂度。但多通道视频流的各个通道由于是对同一场景的拍摄,除了通道的平移和旋转,各个通道的内容之间具有很强的空间域上的相关性,这给高效压缩多通道视频流带来了可能性。
目前国际上研究的比较多的对多通道视频流编码的方法有二类,第一类基于MPEG视频编码标准,第二类基于深度图像渲染(DIBR,Depth-Image-BasedRendering)技术,这两类方法有各自的特点。
第一类方法基于MPEG视频编码标准。
2003年5月,由ITU-T和ISO/IEC的专家共同组成的联合视频小组JVT(Joint Video Team)制定了视频编码国际标准H.264/AVC。H.264采用了混合编码框架结构,采用了最小4×4的可变块运动预测、多个参考图像帧、上下文自适应的二进制算术编码等等先进技术,对单个通道视频流进行压缩编码可以取得很高的效率。
JVT目前正在研究制定多视点编码(MVC,Muiti-view Video Coding)国际标准。MVC利用了视点内部和不同视点之间的图像帧的相关性,利用H.264/AVC进行编码压缩,由于采用时间和空间的联合预测编码,同各个视点独立编码的联播(Simulcast)相比,目前实验显示,在不同的视频内容下,时空联合编码可提高0.5dB到3dB的增益。参见:P.Merkle,A.Smolic and K.Muller,Efficient prediction structures for multiview video coding,IEEE Trans.CSVT,vol.17,no.11,pp.1461-1473,2007。
MVC利用视差预测获得的视差矢量来代表通道之间的位移,其确定视差矢量的代价函数的目标是码率最小,这是一种不精确的位移表示方法,使得该位移矢量只能够表示两个通道之间的位移关系,而不能够转化为物体的深度信息,进而表示多个通道之间的位移关系。所以MVC在每两个相邻通道的关键帧之间都需要一个视差矢量。
MVC把单个通道在时间域上的图像帧分成固定长度的图像组(GOP,Groupof Picture),GOP的长度放映了单个视频流的图像帧在时间域上的相关性。MVC对两个相邻通道之间的关键帧作视差预测,视差矢量反映的是两个相邻通道的图像帧在空间域上的相关性,但是GOP的长度决定了视差预测的周期,因而限制了更好的挖掘图像帧的空间相关性。
MVC需要编码每个视点通道,其编码结构比较复杂,需要大的计算量、长的编码延时和大的参考帧存储空间。当需要编码的通道数目增加时,码率也相应增加。MVC编码、传输所有的视点,将拍摄图像的尺寸和摄像机距离同显示端的图像尺寸和观看距离联系在一起,这样限制了显示端观看位置的灵活性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810062864.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置