[发明专利]进行运动估计的方法、装置及存储介质有效
申请号: | 201710894492.7 | 申请日: | 2017-09-28 |
公开(公告)号: | CN109587501B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张宏顺 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N19/523 | 分类号: | H04N19/523;H04N19/567;H04N19/61 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 运动 估计 方法 装置 存储 介质 | ||
本发明公开了一种进行运动估计的方法、装置及存储介质,属于互联网技术领域。所述方法包括:获取AMVP的目标MV和AMVP的最小RDcost值;将以AMVP的目标MV在参考帧中的映射点为初选点进行IME得到的IME的目标MV放大到四分之一像素精度,得到QME的参考目标MV;当AMVP的目标MV和QME的参考目标MV相同时,将AMVP的目标MV和AMVP的最小RDcost值确定为最终结果。本发明通过计算候选MV列表中每个MV的RDcost,获取AMVP的目标MV,通过将IME的目标MV放大到四分之一精度,获取QME的参考目标MV,当AMVP的目标MV与QME的参考目标MV相同时,无需进行HME和QME,直接将AMVP的目标MV和AMVP的最小RDcost值作为最终结果,从而减小了进行HME和QME计算的计算量,缩短了运动估计过程的时长,同时降低了资源消耗。
技术领域
本发明涉及互联网技术领域,特别涉及一种进行运动估计的方法、装置及存储介质。
背景技术
运动估计为视频编码中最重要的组成部分,是指将每帧图像分割成至少一个互不重叠的宏块,并按照指定搜索算法在参考帧的指定区域内搜索出与每个宏块最相似的匹配块的过程。通过进行运动估计不仅能够降低视频编码过程的复杂度,而且能够减少视频传输过程的比特数,因而在视频编码过程中需要进行运动估计。
相关技术在进行运动估计时,主要采用如下方法:采用AMVP(Advanced MotionVector Prediction,高级运动向量预测)方法,利用空域运动向量和时域运动向量的相关性,为当前PU(Predicting Unit,预测单元)(PU即宏块)建立候选MV(Motion Vector,运动向量)列表;采用SAD(Sum of Absolute Differences,绝对误差和)方法,计算候选MV列表中每个MV的RDcost(Rate Distortioncost,率失真代价),得到至少一个RDcost值;从至少一个RDcost值中,获取最小的RDcost值,并将最小的RDcost值对应的MV作为AMVP的目标MV;以AMVP的目标MV在参考帧中的映射点为初选点进行IME(Integer Motion Estimation,整像素运动估计),并从计算结果中获取IME的目标MV;以IME的目标MV在参考帧中的映射点为初选点进行HME(Half Motion Estimation,二分之一像素运动估计),并从计算结果中获取HME的目标MV;以HME的目标MV在参考帧中的映射点为初选点进行QME(Quarter MotionEstimation,四分之一像素运动估计),并从计算结果中获取QME的目标MV和QME的最小RDcost值,将该QME的目标MV和QME的最小RDcost值确定为运动估计过程的最终结果。
然而,进行二分之一像素运动估计和四分之一像素运动估计的计算量较大,导致运动估计过程时间较长,资源消耗较大。
发明内容
为了解决相关技术的问题,本发明实施例提供了一种进行运动估计的方法、装置及存储介质。所述技术方案如下:
第一方面,提供了一种进行运动估计的方法,所述方法包括:
对于待编码图像中任一预测单元PU,基于高级向量预测AMVP为所述PU构建候选运动向量MV列表,所述候选MV列表包括所述PU的至少一个MV;
计算所述候选MV列表中每个MV的率失真代价RDcost,并从计算结果中获取AMVP的目标MV和AMVP的最小RDcost值;
以所述AMVP的目标MV在参考帧中的映射点为初选点进行整像素运动估计IME,并从计算结果中获取整像素运动估计的目标MV;
将所述整像素运动估计的目标MV放大到四分之一像素精度,得到四分之一像素运动估计的参考目标MV;
当所述AMVP的目标MV和所述四分之一像素运动估计的参考目标MV相同时,将所述AMVP的目标MV和所述AMVP的最小RDcost值确定为运动估计过程的最终结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710894492.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 一种H.264分数倍运动估计方法与系统-202011101474.7
- 刘镇;陈励;余顺文 - 浙江天则通信技术有限公司
- 2020-10-15 - 2023-07-11 - H04N19/523
- 本发明涉及一种H.264分数倍运动估计方法及系统,通过整数倍运动估计算法从参考帧宏块中搜索与当前帧宏块具有第一最小代价速率失真值的匹配数据块,对所述匹配数据块逐块进行分数倍插值,包括对水平方向上1/2像素点进行插值,对垂直方向上1/2像素点进行插值,对水平方向上1/4像素点进行插值,对垂直方向上1/4像素点进行插值,对右斜方向上1/4像素点进行插值,对左斜方向上1/4像素点进行插值,获得25个像素点构成的插值数据块。本发明采用整数倍运动估计算法进行粗略估计后,通过分数倍插值,获得25个像素点构成的插值数据块,只使用了25/49的计算量,提高了计算速度。
- 一种视频图像的处理方法和装置-201711050289.8
- 张宏顺 - 腾讯科技(深圳)有限公司
- 2017-10-31 - 2022-08-19 - H04N19/523
- 本发明实施例公开一种视频图像的处理方法和装置,保证视频压缩性能的情况下提升编码速度,降低计算复杂度。在该方法中,对当前图像帧进行整像素运动估计,得到整像素估计出的最优位置;对整像素估计出的最优位置进行二分之一像素估计,得到二分之一像素估计出的最优位置;将二分之一像素估计出的最优位置的周围区域划分为四个分区;根据与二分之一像素估计出的最优位置相邻的四个二分之一像素位置分别对应的率失真代价,从四个分区中确定出用于四分之一像素估计的第一分区;根据二分之一像素估计出的最优位置在第一分区内进行四分之一像素估计,得到四分之一像素估计出的最优位置;以四分之一像素估计出的最优位置作为运动估计结果进行运动补偿。
- 进行运动估计的方法、装置及存储介质-201710894492.7
- 张宏顺 - 腾讯科技(深圳)有限公司
- 2017-09-28 - 2022-07-12 - H04N19/523
- 本发明公开了一种进行运动估计的方法、装置及存储介质,属于互联网技术领域。所述方法包括:获取AMVP的目标MV和AMVP的最小RDcost值;将以AMVP的目标MV在参考帧中的映射点为初选点进行IME得到的IME的目标MV放大到四分之一像素精度,得到QME的参考目标MV;当AMVP的目标MV和QME的参考目标MV相同时,将AMVP的目标MV和AMVP的最小RDcost值确定为最终结果。本发明通过计算候选MV列表中每个MV的RDcost,获取AMVP的目标MV,通过将IME的目标MV放大到四分之一精度,获取QME的参考目标MV,当AMVP的目标MV与QME的参考目标MV相同时,无需进行HME和QME,直接将AMVP的目标MV和AMVP的最小RDcost值作为最终结果,从而减小了进行HME和QME计算的计算量,缩短了运动估计过程的时长,同时降低了资源消耗。
- 分像素插值方法、系统、计算机设备和介质-201810294119.2
- 刘家瑛;夏思烽;杨文瀚;胡越予;郭宗明 - 北京大学;北大方正集团有限公司;北京北大方正电子有限公司
- 2018-03-30 - 2021-06-15 - H04N19/523
- 本发明提供了一种分像素插值方法、系统、计算机设备和介质。其中,一种分像素插值方法,包括:对训练集中的每一张原始图像进行处理,得到整像素块和分像素块;将整像素块前向传播到卷积神经网络,得到分像素块的预测值;计算分像素块的预测值与分像素块的均方差;将均方差反向传播到卷积神经网络,以更新卷积神经网络各层的权值,循环迭代直至卷积神经网络收敛,得到分像素插值网络。通过本发明的技术方案,实现了通过单一网络即可插值出属于不同分像素位的参考块,并使得视频压缩的性能得到提升。
- 一种视频解码设备-201610349136.2
- 宋振翰;林晶娟;李英烈;文柱禧;金海光;全炳宇;韩钟基;金正弼;金旲衍 - SK电信有限公司
- 2011-10-06 - 2019-09-10 - H04N19/523
- 使用高精度滤波器编码/解码视频的方法和设备。一种视频解码设备,所述视频解码设备包括:解码单元,其用于从比特流提取量化频率变换块;逆量化单元,其用于通过对所述量化频率变换块进行逆量化来重构频率变换块;逆变换单元,其用于通过对所述频率变换块进行逆变换来重构残余块;预测单元,其用于利用FIR滤波器或线性插值根据对当前块的运动向量所参照的基准块的子采样值进行插值所获得的值来生成预测块;以及加法单元,其用于通过将重构的残余块和所述预测块相加来重构所述当前块。
- 性能和带宽高效的分数运动估计-201280071900.4
- 李相熙;J·D·坦纳 - 英特尔公司
- 2012-04-26 - 2019-04-05 - H04N19/523
- 此处描述了涉及用于视频编码的运动估计的技术。具体而言,对参考视频帧执行整数估计,并确定最佳尺寸宏块。对该最佳尺寸宏块,执行分数估计。基于分数估计,判断是否从整数估计产生了对宏块的改善。如果产生了这样的改善,则更新来自整数搜索/估计的最佳尺寸宏块的所有子形状。此外,还选择新子宏块作为用于视频编码的最后一个宏块。
- 使用高精度滤波器编码/解码视频的方法和设备-201610348345.5
- 宋振翰;林晶娟;李英烈;文柱禧;金海光;全炳宇;韩钟基;金正弼;金旲衍 - SK电信有限公司
- 2011-10-06 - 2019-03-26 - H04N19/523
- 使用高精度滤波器编码/解码视频的方法和设备。一种视频编码设备,所述视频编码设备包括:预测单元,用于利用FIR滤波器或线性插值根据对当前块的运动向量所参照的基准块的子采样分量值进行插值所获得的值来生成预测块;减法单元,用于通过从所述当前块减去所述预测块来生成残余块;变换单元,用于通过对所述残余块进行变换来生成频率变换块;量化单元,用于通过对所述频率变换块进行量化来生成量化频率变换块;以及编码单元,用于将所述量化频率变换块编码为比特流。
- 图像处理设备和方法-201410569464.4
- 佐藤数史 - 索尼公司
- 2010-04-22 - 2018-11-02 - H04N19/523
- 所公开的主题内容涉及一种图像处理设备和方法,该图像处理设备包括:选择部,其根据以进行编码处理的图像作为对象来对成为编码处理的对象的对象块的像素进行帧内预测时的预测方向和块大小,选择是使对该对象块的像素进行帧内预测时所参照的相邻像素的相位移动、还是不使相邻像素的相位移动;以及帧内预测部,其利用相邻像素,对该对象块的像素进行帧内预测。
- 运动矢量压缩方法和装置-201510091702.X
- 马思伟;马俊铖;王苫社;罗法蕾 - 北京大学
- 2015-02-28 - 2018-10-16 - H04N19/523
- 本发明公开了一种运动矢量的压缩方法和装置,以解决现有技术中对运动矢量压缩编码时间耗时长、性能局限的问题。所述方法包括搜索运动矢量的像素精度区域,对所述运动矢量按照两个不同的像素精度区域进行搜索;对第一区域的MV采用第一表示法进行表示,对第二区域的MV采用第二表示法进行表示。本发明通过在运动搜索的过程中对所述运动矢量按照不同像素精度区域的方式进行分区搜索,对低像素精度区域的部分像素进行舍弃,而后对不同像素精度区域的MV进行适当的转换并采用不同的表示方法进行表示,从而达到压缩运动矢量的目的,对压缩后的运动矢量进行编码,减少了码流,优化了运动估计性能,提高了运动估计速度,实现编码性能的增益。
- 图像处理设备和方法-201410566930.3
- 佐藤数史 - 索尼公司
- 2010-04-22 - 2018-09-14 - H04N19/523
- 所公开的主题内容涉及一种图像处理设备和方法,该图像处理设备包括:存储器,其存储根据以对位流进行解码处理而得到的图像作为对象来对成为解码处理的对象的对象块的像素进行帧内预测时所参照的相邻像素;选择部,其根据对该对象块的像素进行帧内预测时的预测方向和块大小,选择是使从存储器读出的相邻像素的相位移动、还是不使从存储器读出的相邻像素的相位移动;帧内预测部,其利用相邻像素,对该对象块的像素进行帧内预测,生成预测图像;以及解码部,其利用帧内预测部生成的预测图像,对位流进行解码处理。
- 图像处理设备和方法-201410567414.2
- 佐藤数史 - 索尼公司
- 2010-04-22 - 2018-09-04 - H04N19/523
- 所公开的主题内容涉及一种图像处理设备和方法,该图像处理设备包括:存储器,其存储根据以进行编码处理的图像作为对象来对成为编码处理的对象的对象块的像素进行帧内预测时所参照的相邻像素;选择部,其根据对该对象块的像素进行帧内预测时的预测方向和块大小,选择是使从存储器读出的相邻像素的相位移动、还是不使从存储器读出的相邻像素的相位移动;帧内预测部,其利用所述相邻像素,对该对象块的像素进行帧内预测,生成预测图像;以及编码部,其利用该帧内预测部生成的预测图像,对该图像进行编码处理。
- 图像处理设备和方法-201410566976.5
- 佐藤数史 - 索尼公司
- 2010-04-22 - 2018-08-31 - H04N19/523
- 所公开的主题内容涉及一种图像处理设备和方法。一种图像处理设备,包括:选择部,其根据以对位流进行解码处理而得到的图像作为对象来对成为解码处理的对象的对象块的像素进行帧内预测时的预测方向和块大小,选择是使对对象块的像素进行帧内预测时所参照的相邻像素的相位移动、还是不使相邻像素的相位移动;以及帧内预测部,其利用相邻像素,对该对象块的像素进行帧内预测。
- 插值方法和使用其的预测方法-201180073166.0
- 全勇俊;贾杰;全柄文;朴胜煜 - LG电子株式会社
- 2011-07-28 - 2017-05-10 - H04N19/523
- 本发明涉及通过使用当前图片的像素采样和参考图片的像素采样来执行用于在屏幕之间预测的插值的方法、以及使用其的预测方法。按照本发明的插值方法包括计算用于产生预测块的运动信息;以及基于整数采样集产生部分像素采样,整数采样集包括插值滤波器被应用到其的整数像素采样,在这里,整数采样集包括在当前图片的恢复的整数像素采样之中的用于产生部分像素采样的至少一个当前整数采样,以及部分像素采样对应于在整数像素采样之中的离预先确定的参考像素采样的部分像素单位的偏移位置。
- 一种H.264运动估计编码的全面运动估计改进算法-201410182288.9
- 缪云彬;陈泽琳;姜莎莎 - 华南理工大学
- 2014-04-30 - 2017-02-15 - H04N19/523
- 本发明公开了一种H.264运动估计编码的全面运动估计改进算法,包括以下步骤1)提出了整像素精度下的,基于UMHexagonS算法的自适应视频运动估计搜索算法,包括自适应地改进非对称十字搜索步长和范围以及自适应地改进5×5中心偏置螺旋搜索;2)提出了分像素精度下的,基于FFPS、CBFPS算法的多矢量相关预测快速搜索算法,即根据当前最佳运动矢量的整数部分和相邻块运动矢量的整数部分具有相似性的特点,将相关特性结合,确定分像素起始运动矢量的选择;3)分析各种类型的视频运动估计时间。本发明对于减少视频运动估计搜索,提高视频运动估计时间具有重要意义。实验表明,改进算法在引起少量的质量失真和码率增加的情况下,平均减少了15%的运动估计时间。
- 图像处理设备和方法-201280052450.4
- 近藤健治 - 索尼公司
- 2012-10-25 - 2014-07-02 - H04N19/523
- 本公开涉及一种能够抑制编码效率的降低的图像处理设备和方法。该图像处理设备具备:控制器,所述控制器根据运动向量的精度,控制被按照进行运动补偿的帧间预测模式的候选者;运动搜索单元,所述运动搜索单元只按照被控制器允许成为所述候选者的帧间预测模式,进行运动搜索,从而生成运动向量;和运动补偿单元,所述运动补偿单元按照由运动搜索单元分别被按照来生成运动向量的各个候选者中选择的帧间预测模式,来进行运动补偿,从而生成预测图像。本公开可以适用于图像处理设备。
- 编码设备和编码方法,及解码设备和解码方法-201280052477.3
- 近藤健治 - 索尼公司
- 2012-10-25 - 2014-07-02 - H04N19/523
- 本发明涉及当在帧间预测时进行分数精度的运动补偿操作时,能够提高编码效率的编码设备和编码方法,以及解码设备和解码方法。当运动向量的精度为1/4像素精度,而预测向量的精度为1/8像素精度时,按照包含在图像压缩信息中的检测精度信息,预测向量变换单元对预测向量进行舍入处理,从而生成1/4像素精度的预测向量。运动向量生成单元相加1/4像素精度的预测向量和包含在图像压缩信息中的差分向量,从而生成运动向量。帧间预测单元和计算单元通过利用所述运动向量,进行运动补偿操作,对图像解码。例如,本发明可应用于解码设备。
- 专利分类