[发明专利]基于运动矢量分布预测的快速运动估计视频编码方法有效

专利信息
申请号: 201310098216.1 申请日: 2013-03-26
公开(公告)号: CN103188496A 公开(公告)日: 2013-07-03
发明(设计)人: 高原;刘鹏宇;贾克斌 申请(专利权)人: 北京工业大学
主分类号: H04N7/26 分类号: H04N7/26;H04N7/32;H04N7/36
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 张慧
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于视频压缩编码领域,公开了一种基于运动矢量分布预测的快速运动估计视频编码方法。该方法首先从原始视频数据中提取当前宏块的亮度信息,针对整像素运动矢量分布特征搜索设计简洁的运动估计搜索模板,合理分配搜索点数。然后对运动矢量分布进行预测,根据预测结果自适应地选择在搜索模板相应区域内小范围搜索。在运动估计搜索过程中对运动矢量是否为0进行判断,作为跳过模板搜索的判据。本发明方法与视频编码标准H.264中采用的运动估计搜索算法及其它改进算法相比较,能有效地加速运动估计搜索过程,减少运动估计耗时,严格控制了码率增加,保证了较好的重构图像质量,实现了快速运动估计编码。
搜索关键词: 基于 运动 矢量 分布 预测 快速 估计 视频 编码 方法
【主权项】:
1.一种基于运动矢量分布预测的视频快速运动估计编码方法,其特征在于该方法根据当前宏块运动矢量分布预测自适应地选择模板搜索区域,在大范围模板搜索之前对运动矢量是否为0进行预测,加入提前终止准则,进而实现对帧间宏块的快速运动估计视频编码,具体包括以下步骤:步骤一,从当前视频帧中提取当前被预测宏块的亮度信息作为编码对象;步骤二,确定双重运动估计搜索模板,进行搜索点数分配;步骤三,确定高准确的初始搜索点:由拉格朗日率失真优化(RDO-Rate Distortion Optimization)函数作为运动估计判决依据,选择率失真意义上最佳匹配预测块和最优运动矢量,使得运动矢量和残差编码的比特分配最小;利用拉格朗日率失真准则选择最优运动矢量问题可描述为:Jmotion(mv,ref|λmotion)=SAD[s,r(ref,mv)]+λmotion[R(mv-pred)+R(ref)]其中,Jmotion为当前预测的运动矢量的率失真代价值s为当前宏块像素值,mv为当前运动矢量,pred为预测运动矢量,ref为参考帧,r(ref,mv)为参考宏块的像素值,R是运动矢量进行差分编码消耗的比特数,包括运动矢量与其预测值的差值编码比特数和参考帧的编码比特数;λmotion为拉格朗日乘子,SAD(Sum of Absolute Difference)为当前块与参考块像素间的绝对误差和:SAD[s,r(ref,mv)]=Σx=1B1Σy=1B2|s(x,y)-r(x-mx,u-my)|]]>其中,B1和B2分别表示块的水平像素和垂直像素,根据不同的帧间预测模式,其取值可为16,8,4;s(x,y)为当前宏块像素值;r(x,y)为参考宏块的像素值,mx和my分别表示水平和垂直方向的位移量;利用拉格朗日率失真准则选择最优模式的问题可表述为:Jmode(s,c,MODE|λmode)=SSD(s,c,MODE|QP)+λmode×R(s,c,MODE|QP)   (1)其中,MODE表示当前宏块的一种帧间编码模式,Jmode(s,c,MODE|λmode)表示MODE模式下的率失真代价值s为原始的视频信号,c为采用MODE模式编码后的重构视频信号,λmode为拉格朗日乘子,R(s,c,MODE|QP)是与MODE和量化参数有关的包括宏块头信息、运动矢量和所有DCT块信息的总的二进制位数,QP是编码量化步长,SSD(s,c,MODE|QP)(Sum of Square Difference)为原始信号与重构信号之间的平方差之和,即:SSD(s,c,MODE|QP)=Σi=1,j=1B1,B2[SY(x,y)-CY(x,y,MODE|QP)]2]]>+Σi=1,j=1B1,B2[SU(x,y)-CU(x,y,MODE|QP)]2+Σi=1,j=1B1,B2[SV(x,y)-CV(x,y,MODE|QP)]2]]>其中,B1和B2分别表示块的水平像素和垂直像素,其取值可为16,8,4;SY(x,y)为源宏块亮度信息的取值,CY(x,y,MODE|QP)表示重建宏块的亮度信息的取值,SU,SV和CU,CV分别表示相应的色差信息的取值;具体包括以下步骤:(1)采用多种预测方式进行起始点预测:1)进行空间域的中值预测MVpred_space:利用相邻宏块间的相关性,当前预测宏块的运动矢量由已知的周围邻块的运动矢量预测得到;2)进行多尺寸块划分的上层块预测MVpred_uplayer:利用帧间运动估计宏块划分特征,当前预测宏块运动矢量从7个模式的分级搜索顺序求出同位置、上一级和大一倍尺寸块的运动矢量;3)进行时间域的参考帧运动矢量预测MVpred_ref:利用当前宏块在不同参考帧中的运动矢量具有相关性,当前宏块运动矢量由之前参考帧中当前块的运动矢量按一定比例预测得到;(2)将上述三种运动矢量预测模式所指向点的率失真代价值分别记为space_predmincost,uplayer_predmincost和ref_predmincost,将具有最小率失真代价值的运动矢量指向点作为起始搜索点,本步骤的最佳匹配点作为下一步要预测运动矢量的终点;步骤四,判断运动矢量是否为0:上一步中得到当前宏块最佳匹配点的运动矢量记为(MVx,MVy),若MVx=0且MVy=0,则视为此时运动矢量为0,跳过步骤五,直接进行步骤八;步骤五,预测当前宏块进行运动矢量方向:根据下一步非对称十字形搜索模板特点将当前预测宏块运动矢量分为四个方向,即水平正方向、水平负方向、垂直正方向和垂直负方向;步骤六,进行非对称十字形搜索:垂直搜索范围是水平搜索范围的一半,相邻搜索点之间步长为两个像素;根据第五步中当前宏块运动矢量方向预测结果自适应地选择搜索方向:判定为水平正方向时,搜索初始点水平正方向上的8个搜索点;判定为水平负方向时,搜索初始点水平负方向上的8个搜索点;判定为垂直正方向时,搜索初始点垂直正方向上的4个搜索点;判定为垂直负方向时,搜索初始点垂直负方向上的4个搜索点;本步骤中确定的最佳匹配点将作为下一步要预测运动矢量的终点;步骤七,将当前预测宏块运动矢量大小分为运动矢量较大、运动矢量中等和运动矢量较小三个级别,判断当前宏块运动矢量大小;步骤八,选择性地进行5×5像素全搜索:根据步骤七中预测当前宏块运动矢量大小结果选择性地进行5×5像素全搜索;只在运动矢量较小时或运动矢量为0时才以当前预测点为中心,在其周围4×4区域内进行5×5个搜索点数的全搜索;否则不进行5×5全搜索,直接进入步骤九;步骤九,对当前宏块再次判断运动矢量是否为0,并进行运动矢量方向预测和运动矢量大小预测:对步骤八中的最佳匹配点进行再次预测,其中判断运动矢量是否为0和运动矢量大小预测方法与上述步骤四和步骤七相同;若运动矢量为0,则跳过步骤十,直接进行步骤十一;若运动矢量不为0,则通过运动矢量方向预测和运动矢量大小预测得到当前宏块运动矢量分布预测结果;根据下一步非均匀多层六边形网格搜索模板特点将当前预测宏块运动矢量分为八个方向:(-22.5°,22.5°],(157.5°,202.5°],(22.5°,67.5°],(-157.5°,-112.5°],(67.5°,112.5°],(-112.5°,-67.5°],(112.5°,157.5°],(-67.5°,-22.5°];步骤十,进行非均匀多层六边形网格搜索:根据步骤九中当前宏块运动矢量分布预测结果自适应地选择运动估计搜索区域:由运动矢量大小和运动矢量方向确定运动矢量在非均匀多层六边形网格搜索模板32个区域中的位置;所在区域内根据运动矢量分布特征分配1~6个搜索点,将搜索到的最佳匹配点作为步骤十一的初始搜索中心点;步骤十一,拓展对称六边形搜索:先以2个像素精度为步长进行对称六边形搜索,将最佳匹配点作为起始点再以1个像素精度为步长进行菱形搜索,最终的最佳匹配点即为当前宏块整数像素运动估计搜索的最佳匹配点;步骤十二,输出运动估计编码信息,包括运动估计时间(Total ME time)、码率(Bit-rate)、峰值信噪比(Y-PSNR),以评价编码算法质量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310098216.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top