[发明专利]视频编码中快速的模式确定方法和装置无效
申请号: | 200710048114.3 | 申请日: | 2007-11-13 |
公开(公告)号: | CN101150722A | 公开(公告)日: | 2008-03-26 |
发明(设计)人: | 王淑慧;林涛 | 申请(专利权)人: | 同济大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 上海光华专利事务所 | 代理人: | 余明伟 |
地址: | 200092上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 编码 快速 模式 确定 方法 装置 | ||
技术领域
本发明涉及到视频编码系统采用多模式编码时的编码过程,特别是涉及到确定最佳帧间模式的方法和装置。
背景技术
在许多视频压缩标准(如H.264)中,为了获得更好的压缩效果,广泛采用了多模式(multi-mode)的编码方法。如H.264中采用了帧内(intra)编码和帧间(inter)编码方法,而帧内编码和帧间编码又进一步细分为各种不同的编码子模式。在众多模式中选择最佳模式的准则是码率-失真最优化,简写为RD最优化(RD optimization),其中R代表码率(bit-rate),即编码所用的位数(比特数),D代表编码失真(Distortion)。RD最优化是通过一个RD成本函数(或简称成本函数)实现的。对应每种编码模式都有相应的成本函数值,而取得最小成本函数值的模式即为最佳模式。通过采用RD最优化的方法,可在复原图像质量和压缩效率之间做一个最好的折中,但在多种编码模式中搜索最佳模式的过程明显增加了编码器的复杂性和计算量。
图像按宏块编码的方式:
在视频压缩标准中,一幅图像被分成宏块(macroblock)组,宏块是16×16(像素)大小的正方形区域。如图1所示,以176×144大小的图像为例,一幅图像共包含99个宏块。
编码模式介绍:
视频压缩的可行性主要基于视频序列本身的特点。对视频序列来说,同一幅图像的邻近像素之间具有很强的空间相关性,而相继图像之间则具有很强的时间相关性,于是可采用合适的方法去除这种相关性,达到压缩数据的目的。在视频压缩标准中广泛采用的方法为预测编码,即用以前已编码过的像素来预测当前编码块的像素值,得到预测块,然后算出由当前编码块与预测块的差值构成的预测误差块,接下来对预测误差块进行后续的编码过程,即变换编码和量化以及熵编码。在此作以下三个定义:
1、原始编码块中的像素与对应预测块中相应位置像素的差值称为参差。
2、原始编码块与对应预测块的差值构成的预测误差块称参差块。
3、参差块包含的各个数值称为参差数据。
相比原始编码块而言,参差块具有较小的相关性和较低的能量,因此对其编码所用的比特数比对原始编码块直接编码明显减少。预测编码的分类从大的方面讲有两种,即帧内(intra)预测及帧间(inter)预测。帧内预测用同一幅图像内已编过码的邻近块内的像素来预测当前编码块的内容,而帧间预测则是用时间上邻近的其他编码过的图像(称为参考图像)内的像素块来预测当前编码块的内容,在此我们称通过帧间预测得到的预测块为帧间预测块,而通过帧内预测得到的预测块为帧内预测块。对帧间预测来说,在已编码过的图像中搜索与当前块最匹配的块的过程称为运动估计,运动估计主要是为了得到当前块在参考图像内的最匹配的位置,指示其相对位置的矢量称为运动矢量。在运动估计过程中,每个宏块还可进一步划分为更小的子块,对每个子块都要搜索最匹配块,所以划分子块的个数越多,搜索的过程越复杂。每一种划分方法称为一种编码模式,可以有图2所示的划分方法。
图2中,16×16大小的宏块进一步划分为不同大小的子块,图2(b)中对应两个16×8的划分,而图2(c)中对应两个8×16的划分,而图2(d)中对应四个8×8的划分,其中每个8×8的模式可以继续细划分为两个8×4,两个4×8,四个4×4的块,分别如图2(e),(f)和(g)所示,在此所有的图2(d)、(e)、(f)和(g)我们统称为P8×8模式。对每个子块都要进行运动估计,对每种模式(划分方式)都要计算其成本函数的值,而具有最小成本函数值的模式即为最佳模式,所以对于划分模式和参考图像数相对较多的编码标准来说,模式选择是一个非常复杂和计算量很大的过程。
另外,在视频压缩标准(如H.264)中,为了简化有全局运动或近似静止区域的视频的编码,提出了复杂度相对较低的帧间模式,如空码模式,这种模式采用的是16×16大小的宏块,其最匹配块所用的参考图像为时间上最邻接的图像,运动矢量则是由当前宏块的邻近宏块的运动矢量或参考图像内对应位置宏块的运动矢量经过某种计算后得到的。因此,对空码模式,码流中不需要消耗任何比特数来表示此宏块的信息,如参考图像、运动矢量、参差数据等。这种模式不需要运动估计,也不需要编码运动信息,所以是一种相对简单的编码模式。H.264中P类型编码图像的SKIP模式和B类型编码图像的DIRECT16×16模式,以及MPEG4中的NOTCODED模式等都属于空码模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710048114.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电动车辆驱动电机
- 下一篇:两段转子磁极铁芯励磁式直流电机