[发明专利]基于运动矢量分布预测的快速运动估计视频编码方法有效
申请号: | 201310098216.1 | 申请日: | 2013-03-26 |
公开(公告)号: | CN103188496A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 高原;刘鹏宇;贾克斌 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32;H04N7/36 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 运动 矢量 分布 预测 快速 估计 视频 编码 方法 | ||
技术领域
本发明属于视频压缩编码领域,涉及一种基于运动矢量分布预测的视频快速运动估计编码方法。
背景技术
在2003年由国际电信联盟(ITU-T)和国际标准化组织(ISO/IEC)联合颁布提出了新一代视频编码标准H.264/AVC。H.264优异的压缩性能和视频质量使得它在现实生活中被广泛应用,包括数字电视广播、多媒体短信、网络视频流媒体传递和视频实时通信等等。相比于之前的编码标准,H.264在以下几个方面进行了改进:采用1/4像素精度运动估计;支持16×16、16×8、8×l6、8×8、8×4、4×8、4×4共7种尺寸块的预测方式;支持多帧参考;采用4×4整数变换代替8×8的DCT变换;可选2种熵编码方式:基于上下文自适应变长编码(context Adaptive Variable Length Coding,简称CAVLC)和基于上下文自适应二进制算术编码(Context Adaptive Binary Arithmetic Coding,简称CABAC);采用率失真优化技术,编码过程中综合考虑编码性能和码率并进行权衡。虽然H.264在编码性能方面有了很大的改善,但却是以牺牲编码复杂度为代价换取的。H.264的高复杂度计算使得编码耗时长,严重影响了其实时性能,所以对于提升H.264编码速度方面的研究至关重要。
相关研究表明,H.264编码耗时大多来自于帧间预测编码,其中运动估计(Motion Estimation,简称ME)过程占了编码总时间的60%—80%,是增加运算复杂度和影响编码性能的关键部分。近年来,研究者们一直致力于对运动估计过程进行优化,在保证编码性能的同时,尽量缩短运动估计时间。
H.264中对于运动估计采用块匹配运动估计算法,其原理如图1所示。首先将视频一帧分割成若干的M×N块,假设块中所有像素都做相同的平移运动。设前一帧搜索区为(M+2Wx,N+2Wy),当前帧块与前一帧块的位移为d(i,j),在搜索区中如果能找到与当前帧块匹配的前一帧块,该d(i,j)即为所需要的运动矢量MV(Motion vector)。在块匹配方法中,通常采用绝对差值和SAD(Sum of Absolute Difference)作为相关函数来衡量当前块与预测块之间的相关程度,SAD值越小,则表示相关性越强,二者越匹配。
在现有的块匹配运动估计算法中,搜索精度最高的是全搜索算法(FS)。由于FS算法计算复杂度过高,不利于实时应用,为此研究人员相继提出了三步法(TSS)、四步法(FSS)和六边形法(HEXBS)等新的搜索算法,但它们依旧存在搜索点数多,易陷入局部最优的不足。随着研究的深入,针对时空相关性和人眼视觉特性所提出的新算法有了很大发展,典型的有非对称十字多层六边形搜索算法(Unsymmetrical-Cross Multi-Hexagon Search,简称UMHexagonS)。相比于全搜索算法,该算法能降低90%的运动估计时间,峰值信噪比平均下降小于0.05dB,且能维持码率基本不变。
申请号为CN201010140709.3的专利公开了一种基于宏块运动矢量特征分类的快速运动估计视频编码方法,称为NUMHexagonS(New-UMHexagonS)算法,其运动估计搜索方案如图2所示。该算法针对UMHexagonS算法有了很大改进,但仍然存在未能充分利用运动矢量分布特征进行搜索策略制定、对于大型搜索模板搜索区域划分不够精细和忽略了运动矢量为0时的搜索特点等不足。
发明内容
针对现有技术中存在的上述问题,本发明提出了一种新的运动估计搜索算法,在保持低码率和高质量的前提下,通过减少运动估计过程中搜索点数达到缩短视频编码时间,提高编码效率目的。
本发明采用的技术方案为:基于运动矢量分布预测的快速运动估计视频编码方法,针对大范围搜索模板存在搜索点数浪费的缺点,对非对称十字形搜索模板和非均匀六边形网格搜索模板进行了重新设计,并在非对称十字形搜索和非均匀六边形网格搜索之前分别进行运动矢量分布预测,自适应地选择相应的搜索区域,在搜索期间判断运动矢量是否为0,加入提前终止准则,进而实现对帧间宏块的快速运动估计视频编码,其特征在于具体包括下述步骤:
步骤一,从当前视频帧中提取当前被预测宏块的亮度信息作为编码对象;
步骤二,确定双重运动估计搜索模板,进行搜索点数分配,方法如下:
(1)非对称十字形搜索模板:由4个搜索区域组成,垂直上下分别分配4个搜索点数,水平左右分别分配8个搜索点数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310098216.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:轴流风扇及具有其的空调器
- 下一篇:一种适用于高肥力地区板栗种植的复合肥