[发明专利]一种基于Vision Transformer的图像压缩感知重构方法及系统在审
申请号: | 202210552712.9 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114820828A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 刘福涛;王付奎;曹维达;于依冉;王馨悦;李蔚郁;鲁威志;陈龙;许丽媛;姜秋波;万月忠;徐彪;李振玲;杨超尘;李云龙;陈芳 | 申请(专利权)人: | 国网山东省电力公司聊城供电公司;国家电网有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T11/00 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 252052 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 vision transformer 图像 压缩 感知 方法 系统 | ||
本发明涉及一种基于Vision Transformer的图像压缩感知重构方法及系统,包括:(1)对图像依次进行预处理、分块压缩采样操作;(2)对图像通过训练好的初始重构网络进行初始重构,并进行重构和拼接;(3)对图像通过训练好的深度重构网络进行深度重构,得到深度重构图像。本发明提出了一种卷积神经网络和Vision Transformer结合的图像重构混合框架,是一种端到端的压缩重构图像方法,本发明使得图像压缩感知的网络结构能够继承卷积神经网络和Transformer的优点,并且最大程度保留全局和局部特征,提高图像重构的精度。
技术领域
本发明涉及一种基于Vision Transformer的图像压缩感知重构方法及系统,属于图像处理技术领域。
背景技术
压缩感知也可以被叫做Compressed Sampling,即压缩采样。压缩感知是一种能够突破香农的奈奎斯特采样定理,通过利用信号的稀疏特征以远远小于原始信号的测量值,高精度的来重建原始信号的一种方法。压缩感知理论的提出,引起学术界和工业界的广泛关注。在图像处理、光学/微波成像、模式识别、无线通信等领域受到高度关注。
卷积神经网络在压缩图像感知方面取得了成功。然而,由于卷积神经网络感受野通常很小,不利于捕获全局特征,卷积运算在建模长期依赖关系时存在固有的局限性。
Transformer是一种基于自注意力机制的编码器-解码器结构,VisionTransformer将Transformer应用到计算机视觉领域。Vision Transformer可以捕获长距离依赖关系,因此在许多视觉任务中超越许多卷积神经网络结构。
现有的图像压缩感知重构方法利用卷积神经网络进行重构,卷积神经网络感受野小,不利于捕获全局特征。
随着深度学习的发展,将压缩感知与深度学习相结合,显著地提高了信号恢复的性能和速度。
发明内容:
针对现有技术的不足,本发明提供了一种基于Vision Transformer的图像压缩感知重构方法;
本发明还提供了一种基于Vision Transformer的图像压缩感知重构系统。
本发明将卷积神经网络和Vision Transformer结合用于图像的压缩重构,是一种端到端的压缩重构图像方法,由自适应采样和初始重构以及深度重构三部分组成,使得图像压缩感知的网络结构能够继承卷积神经网络和Transformer的优点,并且最大程度保留全局和局部特征,增大感受野,最大程度保留全局和局部特征,提高图像重构的精度。
术语解释:
1、Vision Transformer,是将transformer架构应用到计算机视觉领域的一种模型;
2、Transformer编码器,如图2所示,是重复堆叠编码器块L次,编码器主要由以下几部分组成:Layer norm归一化层,在通道方向上,对每个深度上的输入进行归一化;多头自注意力(Multi-Head Attention)是由多个自注意力机制组合的,自注意力机制是对输入中不同部分之间建立相关性;多层感知机(MLP block)由全连接层、GELU激活函数、dropout组成。是一个传统的神经网络,如图3所示,为了解决单层感知机无法解决的非线性问题。
本发明的技术方案为:
一种基于Vision Transformer的图像压缩感知重构方法,包括步骤如下:
(1)对图像依次进行预处理、分块压缩采样操作;
(2)对步骤(1)处理后的图像通过训练好的初始重构网络进行初始重构,并进行重构和拼接;
(3)对步骤(2)得到的图像通过训练好的深度重构网络进行深度重构,得到深度重构图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司聊城供电公司;国家电网有限公司,未经国网山东省电力公司聊城供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210552712.9/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序