[发明专利]基于运动矢量分布预测的快速运动估计视频编码方法有效
申请号: | 201310098216.1 | 申请日: | 2013-03-26 |
公开(公告)号: | CN103188496A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 高原;刘鹏宇;贾克斌 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32;H04N7/36 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 运动 矢量 分布 预测 快速 估计 视频 编码 方法 | ||
1.一种基于运动矢量分布预测的视频快速运动估计编码方法,其特征在于该方法根据当前宏块运动矢量分布预测自适应地选择模板搜索区域,在大范围模板搜索之前对运动矢量是否为0进行预测,加入提前终止准则,进而实现对帧间宏块的快速运动估计视频编码,具体包括以下步骤:
步骤一,从当前视频帧中提取当前被预测宏块的亮度信息作为编码对象;
步骤二,确定双重运动估计搜索模板,进行搜索点数分配;
步骤三,确定高准确的初始搜索点:
由拉格朗日率失真优化(RDO-Rate Distortion Optimization)函数作为运动估计判决依据,选择率失真意义上最佳匹配预测块和最优运动矢量,使得运动矢量和残差编码的比特分配最小;利用拉格朗日率失真准则选择最优运动矢量问题可描述为:
Jmotion(mv,ref|λmotion)=SAD[s,r(ref,mv)]+λmotion[R(mv-pred)+R(ref)]
其中,Jmotion为当前预测的运动矢量的率失真代价值s为当前宏块像素值,mv为当前运动矢量,pred为预测运动矢量,ref为参考帧,r(ref,mv)为参考宏块的像素值,R是运动矢量进行差分编码消耗的比特数,包括运动矢量与其预测值的差值编码比特数和参考帧的编码比特数;λmotion为拉格朗日乘子,SAD(Sum of Absolute Difference)为当前块与参考块像素间的绝对误差和:
其中,B1和B2分别表示块的水平像素和垂直像素,根据不同的帧间预测模式,其取值可为16,8,4;s(x,y)为当前宏块像素值;r(x,y)为参考宏块的像素值,mx和my分别表示水平和垂直方向的位移量;
利用拉格朗日率失真准则选择最优模式的问题可表述为:
Jmode(s,c,MODE|λmode)=SSD(s,c,MODE|QP)+λmode×R(s,c,MODE|QP) (1)
其中,MODE表示当前宏块的一种帧间编码模式,Jmode(s,c,MODE|λmode)表示MODE模式下的率失真代价值s为原始的视频信号,c为采用MODE模式编码后的重构视频信号,λmode为拉格朗日乘子,R(s,c,MODE|QP)是与MODE和量化参数有关的包括宏块头信息、运动矢量和所有DCT块信息的总的二进制位数,QP是编码量化步长,SSD(s,c,MODE|QP)(Sum of Square Difference)为原始信号与重构信号之间的平方差之和,即:
其中,B1和B2分别表示块的水平像素和垂直像素,其取值可为16,8,4;SY(x,y)为源宏块亮度信息的取值,CY(x,y,MODE|QP)表示重建宏块的亮度信息的取值,SU,SV和CU,CV分别表示相应的色差信息的取值;
具体包括以下步骤:
(1)采用多种预测方式进行起始点预测:
1)进行空间域的中值预测MVpred_space:利用相邻宏块间的相关性,当前预测宏块的运动矢量由已知的周围邻块的运动矢量预测得到;
2)进行多尺寸块划分的上层块预测MVpred_uplayer:利用帧间运动估计宏块划分特征,当前预测宏块运动矢量从7个模式的分级搜索顺序求出同位置、上一级和大一倍尺寸块的运动矢量;
3)进行时间域的参考帧运动矢量预测MVpred_ref:利用当前宏块在不同参考帧中的运动矢量具有相关性,当前宏块运动矢量由之前参考帧中当前块的运动矢量按一定比例预测得到;
(2)将上述三种运动矢量预测模式所指向点的率失真代价值分别记为space_predmincost,uplayer_predmincost和ref_predmincost,将具有最小率失真代价值的运动矢量指向点作为起始搜索点,本步骤的最佳匹配点作为下一步要预测运动矢量的终点;
步骤四,判断运动矢量是否为0:
上一步中得到当前宏块最佳匹配点的运动矢量记为(MVx,MVy),若MVx=0且MVy=0,则视为此时运动矢量为0,跳过步骤五,直接进行步骤八;
步骤五,预测当前宏块进行运动矢量方向:根据下一步非对称十字形搜索模板特点将当前预测宏块运动矢量分为四个方向,即水平正方向、水平负方向、垂直正方向和垂直负方向;
步骤六,进行非对称十字形搜索:垂直搜索范围是水平搜索范围的一半,相邻搜索点之间步长为两个像素;根据第五步中当前宏块运动矢量方向预测结果自适应地选择搜索方向:判定为水平正方向时,搜索初始点水平正方向上的8个搜索点;判定为水平负方向时,搜索初始点水平负方向上的8个搜索点;判定为垂直正方向时,搜索初始点垂直正方向上的4个搜索点;判定为垂直负方向时,搜索初始点垂直负方向上的4个搜索点;本步骤中确定的最佳匹配点将作为下一步要预测运动矢量的终点;
步骤七,将当前预测宏块运动矢量大小分为运动矢量较大、运动矢量中等和运动矢量较小三个级别,判断当前宏块运动矢量大小;
步骤八,选择性地进行5×5像素全搜索:根据步骤七中预测当前宏块运动矢量大小结果选择性地进行5×5像素全搜索;只在运动矢量较小时或运动矢量为0时才以当前预测点为中心,在其周围4×4区域内进行5×5个搜索点数的全搜索;否则不进行5×5全搜索,直接进入步骤九;
步骤九,对当前宏块再次判断运动矢量是否为0,并进行运动矢量方向预测和运动矢量大小预测:对步骤八中的最佳匹配点进行再次预测,其中判断运动矢量是否为0和运动矢量大小预测方法与上述步骤四和步骤七相同;若运动矢量为0,则跳过步骤十,直接进行步骤十一;若运动矢量不为0,则通过运动矢量方向预测和运动矢量大小预测得到当前宏块运动矢量分布预测结果;根据下一步非均匀多层六边形网格搜索模板特点将当前预测宏块运动矢量分为八个方向:
(-22.5°,22.5°],(157.5°,202.5°],(22.5°,67.5°],(-157.5°,-112.5°],
(67.5°,112.5°],(-112.5°,-67.5°],(112.5°,157.5°],(-67.5°,-22.5°];
步骤十,进行非均匀多层六边形网格搜索:根据步骤九中当前宏块运动矢量分布预测结果自适应地选择运动估计搜索区域:由运动矢量大小和运动矢量方向确定运动矢量在非均匀多层六边形网格搜索模板32个区域中的位置;所在区域内根据运动矢量分布特征分配1~6个搜索点,将搜索到的最佳匹配点作为步骤十一的初始搜索中心点;
步骤十一,拓展对称六边形搜索:先以2个像素精度为步长进行对称六边形搜索,将最佳匹配点作为起始点再以1个像素精度为步长进行菱形搜索,最终的最佳匹配点即为当前宏块整数像素运动估计搜索的最佳匹配点;
步骤十二,输出运动估计编码信息,包括运动估计时间(Total ME time)、码率(Bit-rate)、峰值信噪比(Y-PSNR),以评价编码算法质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310098216.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:轴流风扇及具有其的空调器
- 下一篇:一种适用于高肥力地区板栗种植的复合肥