[发明专利]一种基于特征通道相似度的端到端图像压缩方法在审
| 申请号: | 202310125890.8 | 申请日: | 2023-02-16 |
| 公开(公告)号: | CN116320419A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 蒋伟;陈笑;肖睿;杨俊杰;魏春娟 | 申请(专利权)人: | 上海电力大学 |
| 主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/154;H04N19/44;H04N19/91 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 201306 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 通道 相似 端到端 图像 压缩 方法 | ||
1.一种基于特征通道相似度的端到端图像压缩方法,其特征在于,包括以下步骤:
S1、获取待压缩图像,将待压缩图像输入主编码器,得到第一潜在表示;
S2、将第一潜在表示输入去冗余模块,得到去冗余后的第一潜在表示;
S3、将去冗余后的第一潜在表示依次经过超先验编码器和超先验解码器,得到潜在表示概率模型的第一中间参数;
S4、将去冗余后的第一潜在表示经过量化,输入条件上下文模型,得到潜在表示概率模型的第二中间参数;
S5、将第一中间参数和第二中间参数进行拼接,输入熵参数模型,得到高斯分布的均值和标准差;
S6、基于高斯分布的均值和标准差进行对概率分布的估计,得到概率密度函数,根据概率密度函数对S4中量化的去冗余后的第一潜在表示进行编码和解码;
S7、将解码的第一潜在表示输入冗余恢复模块,得到去冗余前的完整潜在表示;
S8、将完整潜在表示输入主解码器,得到重建的图像;
S9、计算重建的图像和待压缩图像的失真以及码率,基于失真以及码率构建损失函数,基于损失函数对S1-S8进行端到端的整体优化;
其中,S2的具体步骤为:
将第一潜在表示输入去冗余模块,计算第一潜在表示的各通道间的相似度,基于相似度划分得到多组相似通道,对同一组的通道的特征进行卷积,将卷积后的多组相似通道的特征合并为单个通道的特征,所述单个通道的特征作为去冗余后的第一潜在表示。
2.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,通道间的相似度的表达式为:
其中,S为两个通道中特征X和特征Y之间的相似度,Xi、Yi分别表示两个通道中特征X和特征Y的第i行向量,N为通道的尺寸。
3.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,S3的具体步骤为:
将去冗余后的第一潜在表示输入超先验编码器,输出边信息的第二潜在表示,将第二潜在表示进行量化,使用因子分解熵模型对量化的第二潜在表示进行编码,得到比特流,将比特流输入解码端,还原出量化的第二潜在表示,将还原的第二潜在表示输入超先验解码器,生成潜在表示概率模型的第一中间参数。
4.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,概率密度函数的表达式为:
其中,为量化的第一潜在表示的概率密度函数,为第i个量化的第一潜在表示,为量化的第二潜在表示,μi为高斯分布的均值,δi为标准差。
5.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,对同一组的通道的特征进行卷积时,采用1x1卷积,卷积核个数为1,通道数和该组内特征通道数相同。
6.根据权利要求3所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,量化采用的方法为:采用添加均匀噪声的方式等效代替推理阶段进行量化。
7.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,待压缩图像的通道数为3,第一潜在表示的通道数为192,S7中,冗余恢复模块通过深度可分离卷积将单个通道的特征恢复为原来的多个通道的特征。
8.根据权利要求7所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,所述深度可分离卷积的卷积核个数为一组相似通道内通道的个数,深度可分离卷积的卷积核的大小为3,步幅为1,填充为1。
9.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,损失函数的表达式为:
Loss=λ*D+R
其中,Loss为损失函数,D为重构图像的失真,R为码率,λ为控制码率和失真的平衡参数。
10.根据权利要求1所述的一种基于特征通道相似度的端到端图像压缩方法,其特征在于,主编码器和主解码器包括6个残差块和2个注意力模块,超先验编码器和超先验解码器由5次卷积组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310125890.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种链式顶升机构
- 下一篇:一种网页服务器指纹识别方法、装置、设备和存储介质





