[发明专利]一种基于神经网络的HEVC帧内编码单元划分方法有效
申请号: | 201810063101.1 | 申请日: | 2018-01-23 |
公开(公告)号: | CN108200442B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 徐枫;陈建武;肖谋 | 申请(专利权)人: | 北京易智能科技有限公司 |
主分类号: | H04N19/96 | 分类号: | H04N19/96;H04N19/176;H04N19/593;G06T5/00 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼;刘东 |
地址: | 100020 北京市朝阳区阜通*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 hevc 编码 单元 划分 方法 | ||
本发明公开了一种基于神经网络的HEVC帧内编码单元划分方法,其特征在于,包括以下步骤:将编码单元输入预处理模块进行去噪处理;将去噪处理后的编码单元进行下采样处理;将下采样处理后的编码单元输入神经网络模型进行结构划分;将结构划分处理后的编码单元进行编码处理。本方案通过采用神经网络模型对分类问题进行高效解决,减少传统四叉树划分编码的复杂性,同时确保编码的失真小,所述神经网络设计分别设计三个通道,并分别对不同大小的编码单元在不同通道中进行分割决策,提高了编码效率。
技术领域
本发明涉及视频编码领域,尤其涉及一种基于神经网络的HEVC帧内编码单元划分方法。
背景技术
视频编码也指视频压缩,通常采用预测、变换、量化和熵编码等方式,尽可能地减少视频数据中的冗余,尽可能使用最少的数据来表征视频,在现有网络的带宽限制下,尽可能地使视频的失真度最小,得到更好的视频观看效果。
视频编码中编码单元(Coding Unit,CU)的四叉树划分选择通常是由编码器计算每种分割方式的RD-costs,选取RD-costs最小的划分方式。这种方法确保了编码的失真最小,但其遍历每种决策的方式大大增加了编码的复杂性。
发明内容
本发明的目的在于:提供一种基于神经网络的HEVC帧内编码单元划分方法,引入神经网络进行分类,在确保编码性能的同时减少编码的复杂性。
本发明采用的技术方案如下:
一种基于神经网络的HEVC帧内编码单元划分方法,包括以下步骤:
S1:将64 x 64编码单元输入预处理模块进行预处理;
S2:将预处理后的编码单元输入到神经网络模型进行结构划分;
S3:将结构划分处理后的编码单元进行编码处理。
进一步的,所述S1具体步骤如下:
S101:将64 x 64编码单元通过四叉树划分方法依次划分为4个32 x 32和16个16x 16编码单元;
S102:将1个64 x 64编码单元通过去噪和下采样处理后得到1个16 x 16的编码单元,然后输入到神经网络结构;
S103:将4个32 x 32编码单元通过去噪和下采样处理后得到4个16 x 16的编码单元,然后输入到神经网络结构;
S104:将16个16 x 16编码单元通过去噪和下采样处理后得到16个16 x 16的编码单元,然后输入到神经网络结构。
进一步的,所述去噪处理采用非局部平均法对编码单元进行去噪处理。
进一步的,所述S2网络模型处理步骤如下:
S201:设计三个通道的神经网络输入层,分别用于接收预处理后的编码单元;
S202:每个通道分别设置卷积核对编码单元进行卷积得到相应特征图;
S203:将特征图经过全连接层处理后通过输出层输出划分预测结果。
进一步的,所述神经网络具有提前截止功能,依次对神经网络的通道进行预测结果判断,并控制下一个通道是否继续进行编码单元划分决策。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明中,通过采用神经网络模型对分类问题进行高效解决,减少传统四叉树划分编码的复杂性,同时确保编码的失真小。
2、本方案通过将神经网络设计三个通道,并分别对不同编码单元进行特征图的分割,提高了编码速度与效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易智能科技有限公司,未经北京易智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810063101.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像亮度处理方法及装置、电子设备
- 下一篇:一种直播流的分发方法和装置