[发明专利]一种基于深度学习的图像压缩方法和装置有效
申请号: | 202010084834.0 | 申请日: | 2020-02-10 |
公开(公告)号: | CN113259676B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 刘家瑛;胡越予;黄浩峰;杨文瀚;郭宗明 | 申请(专利权)人: | 北京大学 |
主分类号: | H04N19/182 | 分类号: | H04N19/182;H04N19/124;H04N19/42;G06T9/00;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 压缩 方法 装置 | ||
1.一种基于深度学习的图像压缩方法,其特征在于,包括以下步骤:
通过多尺度的超先验模型,提取需要编码的图像中多尺度的超先验表示;
获得多尺度的超先验表示的码流,并获得需要编码的图像的系数表示的码流;
将多尺度的超先验表示的码流以及系数表示的码流进行拼接,构成编码后的用于传输的总码流;
所述基于深度学习的图像压缩方法,具体包括以下步骤:
将需要编码的图像流经编码变换子网络,产生量化的图像的系数表示;
将系数表示通过第一层超先验编码变换子网络,产生量化的大尺度超先验表示;
将量化的大尺度超先验表示通过第二层超先验编码变换子网络,产生量化的小尺度超先验表示;
使用零均值正态分布模型,给出量化的小尺度超先验表示的概率似然,使用算术编码器根据该概率似然得到量化的小尺度先验表示的码流;
使用第二层超先验解码变换子网络,解码量化的小尺度超先验表示,得到小尺度超先验信息;
由小尺度超先验信息,使用第二层概率预测子网络,得到一组正态分布的均值和标准差,该均值和标准差是对量化的大尺度超先验表示的概率估计;
使用量化的大尺度超先验表示的概率估计,给出量化的大尺度超先验表示的概率似然,使用算术编码器根据该概率似然得到量化的大尺度先验表示的码流;
使用第一层超先验解码变换子网络,解码量化的大尺度超先验表示,得到大尺度超先验信息;
由大尺度超先验信息,使用第一层概率预测子网络,得到一组正态分布的均值和标准差,该均值和标准差是对量化的图像系数表示的概率估计;
使用量化的图像系数表示的概率估计,给出量化的图像系数表示的概率似然,使用算术编码器根据该概率似然得到量化的图像系数表示的码流;
将量化的小尺度先验表示的码流、量化的大尺度先验表示的码流和量化的图像系数表示的码流进行拼接,构成编码后的用于传输的总码流;
所述的编码变换子网络、第一层超先验编码变换子网络、第二层超先验编码变换子网络、第一层概率预测子网络、第二层概率预测子网络、第一层超先验解码变换子网络、第二层超先验解码变换子网络,采用以下步骤进行训练:
将训练数据输入到神经网络中,让其通过编码变换子网络产生量化的图像系数表示;
将图像系数表示通过第一层超先验编码变换子网络,产生量化的大尺度超先验表示;将量化的大尺度超先验表示通过第二层超先验编码变换子网络,产生量化的小尺度超先验表示;
计算量化的小尺度超先验表示的概率分布与一个零均值正态分布之间的交叉熵,该零均值正态分布的标准差为网络中能够学习的参数;
使用第二层超先验解码变换子网络,解码量化的小尺度超先验表示,得到小尺度超先验信息;
由小尺度超先验信息,使用第二层概率预测子网络,得到一组正态分布的均值和标准差,该均值和标准差是对量化的大尺度超先验表示的概率估计;
计算量化的大尺度超先验表示的概率分布与量化的大尺度超先验表示的概率估计之间的交叉熵;
使用第一层超先验解码变换子网络,解码量化的大尺度超先验表示,得到大尺度超先验信息;
由大尺度超先验信息,使用第一层概率预测子网络,得到一组正态分布的均值和标准差,该均值和标准差是对量化的图像的系数表示的概率估计;
计算量化的图像系数表示和量化的图像的系数表示的概率估计之间的交叉熵;
通过解码变换子网络,由量化的图像系数表示,得到解码后的图像特征;
将解码后的图像特征,以及小尺度超先验信息,大尺度超先验信息,三者共同送入信息整合重建子网络,得到解码变换子网络输出的网络重建结果;
将网络重建结果和输入的图片进行对比,计算设定好的可微误差函数得到一个误差值来衡量误差的程度,误差值乘提前设定的拉格朗日参数,和各交叉熵相加得到最终的目标函数值;
利用随机梯度下降法把目标函数值反向传播到神经网络各层,以更新各层权值;
按照以上步骤训练神经网络,直到神经网络收敛。
2.根据权利要求1所述的方法,其特征在于,在解码过程中,通过信息整合重建子网络整合不同尺度的超先验表示,将超先验表示作为辅助信息与系数表示共同进行最终图像的重建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010084834.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序