[发明专利]一种基于Vision Transformer的图像压缩感知重构方法及系统在审
申请号: | 202210552712.9 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114820828A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 刘福涛;王付奎;曹维达;于依冉;王馨悦;李蔚郁;鲁威志;陈龙;许丽媛;姜秋波;万月忠;徐彪;李振玲;杨超尘;李云龙;陈芳 | 申请(专利权)人: | 国网山东省电力公司聊城供电公司;国家电网有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T11/00 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 252052 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 vision transformer 图像 压缩 感知 方法 系统 | ||
1.一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,包括步骤如下:
(1)对图像依次进行预处理、分块压缩采样操作;
(2)对步骤(1)处理后的图像通过训练好的初始重构网络进行初始重构,并进行重构和拼接;
(3)对步骤(2)得到的图像通过训练好的深度重构网络进行深度重构,得到深度重构图像。
2.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(1)中,分块压缩采样,是指:对预处理后的每张图像分成大小为B×B×l的不重叠的图像块,l表示通道数,设压缩率为s,则nB=[slB2],分块压缩采样表示为式(I):
y=Ws*x (I)
式(I)中,*表示卷积操作,x是输入图像,y是测量值,Ws是nB个大小为B×B×l的滤波器。
3.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(2)中,初始重构,表示为式(II):
式(II)中,*表示卷积操作,y是测量值,的每一列是一个大小为1×l×lB2的向量对应于一个B×B×l的图像块,Wint是lB2个大小为1×l×nB的滤波器;是向量形式,的每一列对应于一个图像块的重构输出。
4.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(2)中,重构和拼接,包括:
利用一个组合层对进行重构和拼接,组合层包括一个reshape函数和一个拼接函数,得到初始重构图像;具体实现过程如下:
a、将每个大小为1×l×lB2的重构向量reshape为一个B×B×l图像块;
b、将所有图像块拼接得到初始重构图像,这个过程表示为式(III):
式(III)中,是大小为1×l×lB2的向量,h、w分别表示行、列的块数,γ(.)是将大小为1×l×lB2的向量转换为B×B×l图像块的reshape函数,k(.)是将所有这些图像块拼接起来得到初始重建图像的拼接函数。
5.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(3)的具体实现步骤包括:
A、将步骤(2)得到的初始重构图像按照B×B×l的大小进行划分得到初始重构图像块,对初始重构图像块进行卷积操作,线性映射得到一维向量,如式(IV)所示:
式(IV)中,W是大小为B×B的lB2个滤波器,是初始重构图像块,p是对h、w两个维度进行展平操作,z0是二维矩阵;
B、将zl-1输入Transformer编码器,l=1…L,Transformer编码器是重复堆叠编码器块L次,包括多个多头自注意力MSA和多层感知机MLP,在每个编码器块前应用Layer Norm(LN)这一归一化方法;
C、利用组合层对经过Transformer编码器后的输出进行重构和拼接,得到深度重构图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司聊城供电公司;国家电网有限公司,未经国网山东省电力公司聊城供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210552712.9/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序