[发明专利]基于多核平台多层次任务级与数据级并行的HEVC解码方法有效
申请号: | 201810239375.1 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108449603B | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 胡栋;韩峰;谷涛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04N19/44 | 分类号: | H04N19/44;H04N19/436;H04N19/176;H04N19/70;H04N19/42;H04N19/82;H04N19/86;H04N19/96;H04N19/124;H04N19/117;H04N19/13;H04N19/91 |
代理公司: | 32224 南京纵横知识产权代理有限公司 | 代理人: | 董建林<国际申请>=<国际公布>=<进入 |
地址: | 210003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 并行 任务模块 自适应补偿模块 多核并行解码 缓冲存储空间 解码器 参考像素点 多核处理器 熵解码模块 并行处理 处理平台 串行解码 读取模块 多核平台 缓存空间 解码效率 滤波模块 数据操作 数据冗余 依赖关系 有效管理 重构模块 码流 算法 像素 样点 流水线 图像 引入 保证 | ||
本发明公开了基于多核平台多层次任务级与数据级并行的HEVC解码方法。本发明利用HEVC数据中的依赖性,以多核处理器为处理平台,同时结合HEVC标准,将整个HEVC解码器划分为5个任务模块,分别为码流读取模块、熵解码模块、像素重构模块、去方块滤波模块以及样点自适应补偿模块;针对不同的解码任务模块分别设计并行方法,同时在各模块间利用各CTU单元的依赖关系实现不同解码任务间基于CTU单元的流水线并行处理。引入数据冗余减少机制,只将部分参考像素点放到缓存空间中,避免过多的数据操作,对缓冲存储空间进行有效管理,提升解码效率。本发明方法采用的多核并行解码算法相比于串行解码,大大提高了解码的并行加速比,并保证了解码图像质量。
技术领域
本发明属于数字视频信号编解码领域,具体涉及基于多核平台多层次任务级与数据级并行的HEVC解码方法。
背景技术
随着高清、超高清视频应用的急剧增加,为提高压缩性能以及满足海量视频数据的传输和存储要求,视频编码联合协作小组JCT-VC在2013年4月正式发布了新一代高效视频编解码国际标准HEVC(High Efficiency Video Coding)。HEVC编解码标准的主要目标是在H.264/AVC标准的基础上,在保证相同视频图像质量的前提下,将高分辨率的视频图像压缩效率提高一倍,使视频流的码率减少50%,进而更好地适应各种不同的网络环境,同时能够支持多核并行编解码。
HEVC的编码框架沿用了H.264/AVC的混合编码框架,是一种基于块的混合编码方案。但与以往的混合编码方案不同,HEVC几乎在每一个编码环节上都采取了重要的改进措施。HEVC将编码帧分为若干相邻但不重叠的方形编码树单元(Coding Tree Unit,CTU),CTU可以按照四叉树的形式进一步划分为若干方形编码单元CU(Coding Unit),CU还可以分解为更小的预测单元PU(Prediction Unit)和变换单元TU(Transform Unit)。HEVC在H.264/AVC预测模式基础上增加了很多方向预测模式来消除图像的空间相关性,每个PU支持35种预测模式。HEVC除了采用和H.264/AVC类似的环内去方块滤波(DeBlocking Filter,DBF)外,还增加了新的样点自适应补偿SAO(Sample Adaptive Offset)环内滤波工具,以此来减少失真。
与以往的视频编解码标准相比,HEVC面临着计算复杂性迅速增加的问题,这直接影响了它的运行和实现,而提高处理速度、增强计算能力的有效方法之一就是在多核平台上进行并行化处理。Tilera系列多核处理器在当前多核处理器市场上就非常具有代表性,它作为一种可重构阵列结构DSP,采用了网格化多核架构,通过iMesh网络实现众多处理器核互连,将单芯片运算处理能力提高了几十到上百倍。国内的很多学者已经在多核处理器上对视频编解码标准做了一些研究。2016年,南京邮电大学的方狄在其论文“基于Tilera多核处理器的HEVC多层次并行解码方法的研究与实现”中将HEVC解码器分为三个任务模块,分别为熵解码模块、像素解码模块以及去方块滤波模块,并就后两个任务模块分别设计基于CTU行的并行方法,用单个核对同一CTU行进行串行解码操作,同时利用任务模块间CTU行的依赖关系实现解码器的并行计算处理。2016年,西南交通大学的刘鹏在其论文“基于多核的嵌入式HEVC解码器并行优化”中研究了一种去方块滤波并行方法,在该方法中,解码器会为每个线程分配均衡数目的CTU行,然后各线程会先对其所负责的多个CTU行进行垂直边界的滤波操作,待一帧图像的垂直边界滤波操作完成后,则再用这些线程对CTU行中所有的水平边界进行处理。但他们的研究有着一定的局限性,如对各任务模块进行并行处理时,是以CTU行为并行粒度,解码器用单个线程去串行解码一行CTU,但像素解码模块和去方块滤波模块其在进行并行化处理时的依赖关系是存在于各CTU单元之上的,而不是CTU行,这在一定程度上会增加时延,同时使得多核资源不能充分利用,造成核资源的浪费。另外去方块滤波的并行处理,完全地将垂直边界与水平边界的滤波操作分离开来,未充分考虑各边界的依赖关系,未能将垂直边界与水平边界的滤波操作相结合以实现并行操作,并行效率未能有效提升。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810239375.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电容器加工用自动上料装置
- 下一篇:一种变压器母线防护装置