[发明专利]视频编码方法和装置有效

专利信息
申请号: 201210298932.X 申请日: 2012-08-21
公开(公告)号: CN103634606A 公开(公告)日: 2014-03-12
发明(设计)人: 王荣刚;万杰;高文;谷沉沉;陈敬昌;吕静;郑全战 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: H04N19/61 分类号: H04N19/61;H04N19/51;H04N19/56;H04N19/176
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 何平;曾旻辉
地址: 518044 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 编码 方法 装置
【说明书】:

技术领域

发明涉及视频编码技术领域,特别是涉及一种视频编码方法和装置。

背景技术

H.264/AVC是由ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准。和以前的视频编码标准比较,H.264/AVC是JVT指定的目前编码效率最高、网络适应性最强的最新视频编码标准。在相同的码率下,H.264/AVC能够获得更好的编码效率和最好的图像质量,尤其是在低码率视频编码方面比MPEG-4有明显提高,非常适于低带宽高质量网络视频应用的需要。为了获得更好的编码效率,H.264/AVC采用了多种新技术,相对之前的视频编码标准也具有更高的计算复杂度,为硬件和软件进行实时编码都增加了难度。对于移动平台来说,计算能力以及网络带宽的限制使得实时视频通讯在移动平台上发展缓慢。因此,降低编码复杂度、提高编码效率对于移动平台上视频的实时传输压缩起到重要作用。

在视频编码中,视频序列是由连续的GOP(Group of Picture,画面组)组成。一个GOP就是一组连续画面,通常以I帧(帧内编码帧)开始,随后是几个P帧(帧间编码帧),并在这些P帧之间插入若干B帧(双向编码帧),GOP的大小可根据编码方式的不同来设置。常用的视频编码技术是先对视频序列进行预测编码,然后传输图像像素与其预测值的差值信号,去除空间或时间的相关性,达到压缩的目的。预测编码包括帧内预测编码和帧间预测编码,其中,帧内预测编码是利用同一帧中的像素值进行预测,帧间预测编码是利用相邻帧中的像素值进行预测。

H.264/AVC编码标准的编码流程中,对于当前输入图像以宏块(例如16x16像素)为单位作为编码单元。当采用帧内编码时,则选择相应的帧内预测编码模式进行帧内预测,然后对实际值和预测值之间的差值进行变换、量化和熵编码得到编码后的码流送入信道传输,同时,编码后的码流又经过反量化和反变换之后重建预测残差图像,在和预测值相加得出重构值,得出的结果经过去方块滤波器平滑之后送入帧存储器作为下一帧编码的参考图像;当采用帧间编码时,输入的图像首先在参考帧中进行运动估计,得到运动矢量,运动补偿后的残差图像经过整数变换、量化和熵编码后与运动矢量一起送入信道传输,同时另一路码流以相同的方式重建去方块滤波后送入帧存储器作为下一帧编码的参考图像,帧间编码模式中用来作为参考对象的是以前编码帧的重建的一帧或多帧。

基于H.264/AVC标准编码时,输入图像主要分为I帧、P帧和B帧,通常将I帧和P帧作为参考帧。编码时,P帧只有前向预测模式,而B帧有前向、后向和双向预测模式。I帧的预测模式都是帧内预测编码模式;P帧和B帧的预测模式包含帧内预测编码模式和帧间预测编码模式,其中帧间预测编码模式占有比较大的比重。

帧间预测是利用已编码重构的视频帧,基于运动补偿的预测模式。当前被编码像素所处的图像帧称为当前帧,用于预测的图像帧称为参考帧。一个16x16像素的编码宏块能够为分为不同的子块,形成7种不同模式的块尺寸(包含16x16、16x8、8x16、8x8、8x4、4x8和4x4),对于每个划分区域都必须有一个独立的运动矢量。每个运动矢量和宏块的划分方式都必须被编码传送。当选择一个大的划分方式的时候,则可使用较少的比特来表示运动矢量和宏块的划分方式,但相应的,在图像的细节区域,运动补偿后的残差图像的能量可能就会比较大。而当选择一个小的划分方式的时候,可得到一个更精确的预测图像,相应的运动补偿后的残差图像的能量就会较小,但这种方式需要比较多的比特来表示运动矢量和宏块的划分方式。

H.264/AVC编码标准在B帧中引入了一种Direct预测模式(直接预测模式),从已编码的信息中获得预测运动矢量直接作为当前宏块的运动矢量,所以不需要编码宏块的任何运动矢量数据。由于B帧是双向预测的,所以Direct模式可以获得指向不同参考帧的两个预测运动矢量。时域Direct模式的前向和后向预测运动矢量是通过时间顺序上下一帧相应位置的运动矢量计算而来;空域Direct模式的前向和后向预测运动矢量是通过前向和后向参考帧相应位置的运动矢量计算得到的。

传统的视频编码方法中,通常是将一个GOP中的第1帧编码为I帧,将第2帧到第2+n帧设定为B帧,并将这n个B帧缓存,然后设定第n+3帧为P帧并编码,最后再依次对第2帧到第2+n帧的B帧进行编码,每个GOP的最后一帧都编码为P帧。如图1所示,为传统技术中的GOP长度为7的编码序列示例,其中箭头表示参考方向。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210298932.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top