[发明专利]一种HEVC的快速编码方法有效
| 申请号: | 201510225448.8 | 申请日: | 2015-05-06 |
| 公开(公告)号: | CN104853191B | 公开(公告)日: | 2017-09-05 |
| 发明(设计)人: | 蒋刚毅;方树清;彭宗举;郁梅;徐升阳;杜宝祯 | 申请(专利权)人: | 宁波大学 |
| 主分类号: | H04N19/109 | 分类号: | H04N19/109;H04N19/147;H04N19/503 |
| 代理公司: | 宁波奥圣专利代理事务所(普通合伙)33226 | 代理人: | 程晓明 |
| 地址: | 315211 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 hevc 快速 编码 方法 | ||
技术领域
本发明涉及一种视频编码技术,尤其是涉及一种HEVC的快速编码方法。
背景技术
随着多媒体与网络技术的飞速发展,MPEG-2、MPEG-4和H.264/AVC等视频编码标准已难以满足用户对超高清视频的高效压缩与传输的要求。国际标准组织ITU-T的VCEG和ISO/IEC的MPEG联合成立了JCT-VC(Joint Collaborative Team on Video Coding),研究并制定了高性能视频编码(High Efficiency Video Coding,HEVC)标准。与H.264/AVC相比,HEVC已基本实现编码效率提高一倍的目标;但由于HEVC在编码结构上采用了尺寸更大的编码块和四叉树编码结构等技术,因此导致了编码复杂度显著增加。
HEVC测试模型(HEVC Test Model,HM)中一个最大编码单元(Largest Coding Unit,LCU)的四叉树结构划分需要采用递归的方式对深度值进行0到3的全遍历。图1给出了一个LCU最终分割形式的确定过程,其需要计算1+4+4×4+4×4×4=85次率失真(Rate-distortion Optimization,RDO)代价,而且每个编码单元(Coding Unit,CU)还要进行帧内、帧间各种预测单元(Prediction Unit,PU)预测模式的遍历。显然,整个LCU的裁剪过程使得编码端的计算复杂度非常之大。Hou等人利用率失真代价确定的阈值来提前终止CU的分割,该方法因未能终止大尺寸CU的预测模式的选择过程,而导致其降低复杂度的能力非常有限。Shen等人通过加权时空域相邻的LCU的深度值预测当前LCU的深度范围(Depth Range,DR),可减少LCU的遍历深度个数,但其未考虑视频序列之间的区别,其采用的固定权重并不适用所有视频序列,其预测的深度范围仍需进一步的改善。Xiong等人利用光流法计算金字塔运动发散(Pyramid Motion Divergence,PMD)的特征值决定CU的分割情况,在一定程度上降低了复杂度,但其未仔细考虑运动矢量间的相关性,导致其编码率失真性能并不佳。
发明内容
本发明所要解决的技术问题是提供一种HEVC的快速编码方法,其在保证视频质量的前提下,能够有效地降低编码复杂度。
本发明解决上述技术问题所采用的技术方案为:一种HEVC的快速编码方法,其特征在于包括以下步骤:
①将高清视频中当前待处理的帧定义为当前帧;
②将当前帧中当前待编码的最大编码单元定义为当前最大编码单元;
③根据当前帧的帧类型及当前最大编码单元在当前帧中的位置,确定当前最大编码单元的所有预测用的最大编码单元;然后将由当前最大编码单元的所有预测用的最大编码单元构成的集合定义为当前最大编码单元的预测集合,并记为Ω,其中,Ω为空集或Ω中所包含的最大编码单元为L、T和COL中的至少一个,L表示当前最大编码单元的左边相邻最大编码单元,T表示当前最大编码单元的上边相邻最大编码单元,COL表示当前帧的前向参考帧中与当前最大编码单元的坐标位置相同的最大编码单元;
④令Dpred表示当前最大编码单元的深度预测值,然后确立Dpred的值与当前最大编码单元的深度遍历区间的一一对应关系,其中,Dpred的值不存在或Dpred的值为实数,且0≤Dpred≤3;
⑤如果Ω为空集或Ω中所包含的最大编码单元为L、T和COL中的一个或Ω中所包含的最大编码单元为L、T和COL中的两个,则确定Dpred的值不存在,然后执行步骤⑦;如果Ω中所包含的最大编码单元为L、T和COL,则确定Dpred的值为实数,且0≤Dpred≤3,然后执行步骤⑥;
⑥通过获取当前最大编码单元与T的空域相似度TAS、当前最大编码单元与L的空域相似度LAS、当前最大编码单元与COL的时域相似度TS,计算Dpred的值,其中,1≤m≤3,1≤i≤256,且m和i均为整数,ωm表示Ω中的第m个最大编码单元所占的权重,当m=1时ωm=LAS,当m=2时ωm=TAS,当m=3时ωm=TS,表示Ω中的第m个最大编码单元中的第i个尺寸大小为4×4的基本存储单元的深度值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510225448.8/2.html,转载请声明来源钻瓜专利网。





