[发明专利]运动估计算法有效

专利信息
申请号: 01801368.6 申请日: 2001-03-13
公开(公告)号: CN1381145A 公开(公告)日: 2002-11-20
发明(设计)人: A·E·拉克特 申请(专利权)人: 皇家菲利浦电子有限公司
主分类号: H04N7/26 分类号: H04N7/26;H04N7/36
代理公司: 中国专利代理(香港)有限公司 代理人: 王岳,傅康
地址: 荷兰艾*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 运动 估计 算法
【说明书】:

发明背景

本发明一般涉及在数字视频编码器中具有特定用途的一种提高硬件效率的高性能运动估计算法。该运动估计算法也可用在其它视频信号处理器中,如用在场频转换器中。

为了尽可能减小传送给定图象质量的数字编码视频数据(“数字视频数据”)所需的带宽,多种不同的视频压缩算法已经被开发用于数字编码(“压缩”)视频数据。几个多媒体技术规范委员会已经建立并提出了用于编码/压缩音频和视频数据的标准。广为人知并被广泛接受的国际标准是由运动图象专家组(MPEG)提供的,它包括MPEG-1和MPEG-2标准。这些用于运动图象压缩的MPEG标准被用在现有的各类视频重放产品中,包括数字多用(或视频)盘(DVD)播放器、具有DVD重放能力的多媒体PC和卫星广播数字视频。

尽管MPEG标准通常提供高图象质量,但对于某些应用来说,数据速率/带宽要求太大了。视频会议是一个特别的应用,它一般不需要MPEG提供的编码分辨率,这是因为图象与图象之间的画面内容一般变化不大,例如在图象中,大部分运动被限定在与会者的头和肩所处的菱形区中。总之,由于在视频会议应用中运动图象序列几乎没有什么运动,因此图象与图象之间会有大量的冗余,结果,对于给定的图象质量来说,视频数据的压缩程度会非常大。而且,许多视频会议的可用带宽小于2M比特/秒,这相对于MPEG传输来说则太慢了。

与MPEG一样,H.261编码算法使用DCT(离散余弦变换)编码和差分编码的组合。但只使用I-图象和P图象。I-图象只使用该图象中所含的信息进行编码,所以它被称作“帧内编码”或“帧内”图象。P-图象使用基于过去参考(或“锚(anchor)”)图象的信息的运动补偿预测(或“运动估计”)进行编码,所以它被称作“预测”或“被预测的”图象。根据H.261标准,压缩的数字视频数据流分层排列在四个层中:图象、块组(GOB)、宏块(MB)和块。图象是顶层。每个图象被分成块组(GOB)。GOB是CIF(公用中间格式)图象的十二分之一。每个GOB被分成33个宏块。每个宏块由16×16的像素阵列构成。

总之,就象MPEG一样,H.261使用运动估计来编码序列图象中那些可能由于运动而发生变化的部分。具体来说,H.261使用“运动矢量”(MV),根据在给定的N×N个像素的搜索范围内的当前宏块的像素与锚图象中的相应像素阵列之间的比较,这些运动矢量规定当前图象内的“宏块”相对于其在锚图象中的原始位置的位置。根据H.261标准,最小搜索范围是+/-7个像素,最大搜索范围是+/-15个像素。应当理解,在所有H.261应用中使用最大搜索范围并不一定能提高压缩信号的质量。在这方面,由于H.261应用能够以范围从64k比特/秒到1,084k比特/秒的各种比特率操作,所以实际采用的搜索范围会有所不同。例如,在高比特率下,相邻图象间的时间间隔较小,因此使用较小的搜索范围就可实现给定的图象质量。在低比特率下,情况正好相反,实现给定的图象质量则需要较大的搜索范围。

一旦一个特定宏块的运动矢量被确定,那么就从当前宏块的相应像素中减去由该运动矢量识别的锚图象中的最匹配宏块的像素值,随后,由此产生的差值使用离散余弦变换(DCT)算法进行变换,其产生的系数均被量化和霍夫曼编码(与运动矢量和其它信息所涉及的一样并识别该宏块)。在运动估计处理期间,如果在锚图象中未检测到充分的宏块匹配(即该差值超过一个预定的阈值量度),或者如果当前图象是I图象,则该宏块被指定为“帧内”宏块并且该宏块被相应地编码。

H.261标准并不规定所采用的运动估计算法的任何特定实施方案。换句话说,H.261为视频会议系统的制造商留下了开放的运动估计算法实施方案的细节。总之,各种测量方法和量度(metrics)被使用并被推荐用于计算与当前宏块最匹配(即最小差值/误差)的锚图象内的像素阵列的位置,并且各种运动估计算法被使用并被推荐用于搜索并确定锚图象中最匹配宏块的位置。这些运动估计(M.E.)算法一般由处理器上运行的软件来执行,处理器可以是PhilipsSemiconductors制造并销售的TriMedia处理器,它的任务是在视频会议系统中编码视频数据。其中心目的是尽快确定锚图象中最匹配宏块的位置,同时尽可能减小处理器执行该算法的负载,并保持一个可接受的误差/不准确度水平。实际执行运动估计搜索算法的硬件/软件有时被称作“搜索引擎”。就搜索引擎而言,其中心目的是优化其性能,同时尽可能减小执行运动估计算法所需的资源。简而言之,其基本目的就是尽可能减少计算量和计算时间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家菲利浦电子有限公司,未经皇家菲利浦电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01801368.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top