[发明专利]基于宏块特征和统计特性的视频帧间压缩编码方法无效

专利信息
申请号: 200910091890.0 申请日: 2009-08-28
公开(公告)号: CN101640802A 公开(公告)日: 2010-02-03
发明(设计)人: 刘鹏宇;贾克斌 申请(专利权)人: 北京工业大学
主分类号: H04N7/32 分类号: H04N7/32
代理公司: 北京思海天达知识产权代理有限公司 代理人: 张 慧
地址: 100124*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于宏块特征和统计特性的视频帧间压缩编码方法,涉及视频压缩编码领域。本发明包括以下步骤:首先从原始视频数据中提取当前编码宏块的亮度信息;根据对当前编码宏块选择最优帧间模式的统计特性,采用双层预判准则,确定最优帧间编码模式;再利用当前编码宏块的时空相关性特征,有选择性进行帧内编码;根据率失真代价函数,将最佳帧间编码模式和最佳帧内编码模式进行比较,确定最终的帧间编码模式对当前宏块进行编码。本发明方法与视频编码标准H.264中采用的遍历式全搜索的帧间预测编码方法相比较,视频质量几乎没有损失;严格控制了码率增加,保持了原标准算法高压缩比的优越性能,并且能够大幅度提高帧间编码速度。
搜索关键词: 基于 特征 统计 特性 视频 压缩 编码 方法
【主权项】:
1、基于宏块特征和统计特性的视频帧间压缩编码方法,是根据对当前编码宏块选择最优帧间模式的统计特性,采用双层预判准则,首先确定最优帧间编码模式;再利用当前编码宏块的时空相关性特征,有选择性进行帧内编码;实现对宏块进行快速的帧间压缩编码,其特征在于包括下述步骤:步骤一:从视频帧中提取当前编码宏块的亮度值;步骤二:确定最佳帧间编码模式,采用拉格朗日率失真优化准则,作为运动估计和模式选择的判决依据,选择率失真意义上的最好的帧间编码模式;率失真代价值,即RD cost,可按照下面的公式计算:Jmode(s,c,MODE|λmode)=SSD(s,c,MODE|QP)+λmode×R(s,c,MODE|QP) (1)式中,MODE表示当前宏块的一种帧间编码模式;s为原始的视频信号;c为采用MODE模式编码后的重构视频信号;λmode为拉格朗日乘子;Jmode(s,c,MODE|λmoode)表示MODE模式下的RD cost,该变量也可以简化表示为RD cost(MODE);R(s,c,MODE|QP)是与模式和量化参数有关的包括宏块头信息、运动矢量和所有DCT块信息的总的二进制位数,它是通过对块进行实际的编码后获得的;QP是编码量化步长;SSD(s,c,MODE)为原始信号与重构信号之间的平方差值和,即: <mrow> <mi>SSD</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>,</mo> <mi>c</mi> <mo>,</mo> <mi>MODE</mi> <mo>|</mo> <mi>QP</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>B</mi> <mo>,</mo> <msub> <mi>B</mi> <mn>2</mn> </msub> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mi>Y</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>]</mo> <mo>-</mo> <msub> <mi>c</mi> <mi>Y</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>MODE</mi> <mo>|</mo> <mi>QP</mi> <mo>]</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>B</mi> <mo>,</mo> <msub> <mi>B</mi> <mn>2</mn> </msub> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mi>U</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>]</mo> <mo>-</mo> <msub> <mi>c</mi> <mi>U</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>MODE</mi> <mo>|</mo> <mi>QP</mi> <mo>]</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>B</mi> <mo>,</mo> <msub> <mi>B</mi> <mn>2</mn> </msub> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mi>V</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>]</mo> <mo>-</mo> <msub> <mi>c</mi> <mi>V</mi> </msub> <mo>[</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>MODE</mi> <mo>|</mo> <mi>QP</mi> <mo>]</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>式中,B1和B2分别表示块的水平像素数和垂直像素数,其取值为16,8,4,sY[x,y],cY[x,y,MODE|QP]表示重建和源视频亮度信号的取值;cU,cV和sU,sV表示相应的色差信号的取值;具体包括以下步骤:1)选取自适应阈值Th:自适应阈值Th由两部分组成,即Th=K×Tmin-RDcost;Tmin-RDcost为上一次宏块编码的最小的RD cost;K为可由上一次宏块编码的最小的RDcost自动变化的调整系数组成;其中K的取值原则如下:当Tmin-RDcost<2000时,变量B=2000;当Tmin-RDcost>12000时,变量B=12000;当2000≤Tmin-RDcost≤12000时,变量B=Tmin-RDcost; <mrow> <mi>K</mi> <mo>=</mo> <mfrac> <mrow> <mn>12000</mn> <mo>-</mo> <mi>B</mi> </mrow> <mn>20000</mn> </mfrac> <mo>;</mo> </mrow>2)计算帧间模式选择中的Skip模式(mode0)的RD cost,即RD cost(mode0),如果RD cost(mode0)小于阈值Th,则直接采用Skip模式为最佳帧间编码模式;否则,计算帧间模式选择中的16×16模式(mode1)的RD cost,如果RD cost(mode0)≤α×RD cost(mode1),则仍可采用Skip模式为最佳帧间编码模式;α为Skip模式的优选调节系数;3)若不满足RD cost(mode0)≤α×RD cost(mode1)的条件,比较帧间模式选择中的模式16×16模式(Mode1),16×8模式(Mode2),8×16模式(Mode3)和8×8模式(Mode4)中的RD cost,只有当Mode4的RD cost满足RD cost(Mode4)≤β×MinRD cost(Modei),i=1,2,3条件时,才需继续搜索较小块编码模式(8×4,4×8,4×4),并计算帧间模式选择中的8×4模式(Mo de5),4×8模式(Mode6),4×4模式(Mode7)的RD cost;再采用RDO函数选择最佳帧间编码模式;其中β为大尺寸宏块模式的优选调节系数;步骤三:确定可选择的最佳帧内编码模式,具体包括以下步骤:1)采用在最佳帧间模式下的当前块及其相邻已编码块的边界像素的平均边界误差,即ABE表示时域相关性,其计算方法如下: <mrow> <mi>ABE</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mn>64</mn> </mfrac> <mi>SBE</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>其中系数64=(16+16)Luma+(8+8)Chroma×2为16×16大小的亮度宏块相邻边界像素与8×8大小的色度宏块相邻边界像素点个数之和,SBE为上述64个像素点与该宏块边界像素点间的差值之和,计算方法为: <mrow> <mi>SBE</mi> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>15</mn> </munderover> <mo>[</mo> <mo>|</mo> <msub> <mi>Y</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>Y</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>Y</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>Y</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>Y</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>|</mo> <mo>]</mo> </mrow> <mrow> <mo>+</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <mo>[</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>,</mo> <mi>cy</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>U</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>cy</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>cy</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>U</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>cy</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>|</mo> <mo>]</mo> </mrow> <mrow> <mo>+</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <mo>[</mo> <mo>|</mo> <msub> <mi>V</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>,</mo> <mi>xy</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>V</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>cy</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>V</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>cy</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>V</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>cx</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>cy</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>|</mo> <mo>]</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>其中YOrig,UOrig,VOrig为当前宏块中被编码的像素值;YRec,URec,VRec为宏块的重建值;(x,y),(cx,cy)分别对应亮度和色度块左上角的像素点位置;2)采用最佳帧间模式下编码运动补偿所消耗的平均比特数,即AR表示空域相关性,其计算方法如下: <mrow> <mi>AR</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mn>384</mn> </mfrac> <mrow> <mo>(</mo> <mi>BTD</mi> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>&lambda;</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>其中λ=0.85×2QP/3,384=(16×16)Luma+(8×8)Chroma×2为亮度宏块与色度宏块中像素点个数之和;BTD的计算方法为: <mrow> <mi>BTD</mi> <mo>=</mo> <mo>[</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>15</mn> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>15</mn> </munderover> <mo>|</mo> <msub> <mi>Y</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>Y</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>+</mo> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <mo>|</mo> <msub> <mi>U</mi> <mi>Qrig</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>U</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>+</mo> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>7</mn> </munderover> <mo>|</mo> <msub> <mi>V</mi> <mi>Orig</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>V</mi> <mi>Rec</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>+</mo> <mi>i</mi> <mo>,</mo> <mi>y</mi> <mo>+</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>]</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>其中YOrig,UOrig,VOrig为当前宏块中被编码的像素值;YRec,URec,VRec为宏块的重建值;(x,y),(cx,cy)分别对应亮度和色度块左上角的像素点位置;3)判断当前宏块是否满足ABE>γ×AR的条件,其中γ为帧内模式的优选调节系数:a)若满足ABE>γ×AR条件,说明当前编码宏块的时域冗余度大于空域冗余度,此宏块选择帧内编码模式的概率较低,可以略过对帧内编码模式的计算,直接采用步骤二中得到的最佳帧间编码模式作为最终的帧间编码模式,则对宏块做运动估计,得到最佳匹配块,求相应的差值,对该值做变换、量化、熵编码,直接进入步骤五;b)若不满足ABE>γ×AR条件,则说明当前编码宏块的空域冗余大于时域冗余度,需要进行帧内编码模式的计算,根据率失真准则,选择率失真意义上的最佳帧内编码模式;步骤四:根据率失真准则,将步骤三中获得的最佳帧内编码模式与步骤二中获得的最佳帧间编码模式做比较,确定最终的帧间编码模式;步骤五:输出最终的压缩视频码流,保存相关的编码信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910091890.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top