[发明专利]基于深度注意力网络的单幅图像超分辨率重建方法及系统有效
申请号: | 202010364389.3 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111583115B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 顿玉洁;杨帅;钱学明 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06V10/774;G06V10/82;G06N3/0464;G06N3/045;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 姚咏华 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 注意力 网络 单幅 图像 分辨率 重建 方法 系统 | ||
1.基于深度注意力网络的单幅图像超分辨率重建方法,其特征在于,包括以下步骤:
步骤1:对开源图像训练数据集DIV2K进行预处理,获得训练集;
步骤2:建立能够对图像进行超分辨率重建的卷积神经网络;
步骤3:将步骤1获得的训练训练集输入步骤2建立的卷积神经网络进行训练,得到超分辨率重建模型;
步骤4:将待处理的低分辨率单幅图像输入步骤3获得的超分辨率重建模型,输出单幅图像超分辨率重建图像;
步骤2建立的超分辨率重建的卷积神经网络包括3个部分:
浅层特征提取网络,由一到两层的卷积层组成,用于将预处理后的图像从颜色空间转换到特征空间,形成特征图;
高频特征提取网络,用于提取浅层特征提取网络后的特征图中的深层特征,获得深层特征图;
重建网络,用于将深层特征图的尺寸变成ground truth图像的尺寸大小,最后将特征从特征空间转换到颜色空间;
高频提取网络由20个CBG模块堆叠而成,每个CBG模块包含一个DDN模块、CAP模块和一层卷积层;
其中,DDN模块包含一个DEN模块和一个瓶颈层;其中,DEN模块中包含6个卷积层;DEN模块中的6个卷积层的卷积核数量分别为:64、48、80、80、64以及96,卷积核大小均为3×3,步长均为1,每一层的激活函数均为ReLU函数,将第3层卷积层的结果进行切片操作,其1/4和第一层卷积层的输入进行拼接操作,另外3/4作为第4层卷积层的输入,再将拼接的特征和第6层进行拼接作为瓶颈层的输入,将前面层的结果和本层卷积层的结果进行拼接操作;最后瓶颈层将卷积核个数降到64,卷积核大小为1×1;
CAP模块为基于注意力机制的模块;瓶颈层的输出作为CAP模块的输入,首先经过一个全局平均池化层,将特征图变成1×1的大小,再经过两个大小为1×1的卷积核,然后特征图通过sigmoid激活函数后,和最初CAP模块的输入进行点到点的相乘操作,得到深层特征图;
超分辨率重建的卷积神经网络的卷积层设置的滤波器大小为3×3,卷积核数量除了高频特征提取网络中的DDN模块外均为64,步长为1,padding的大小为1,激活函数为ReLU函数,池化层采用全局平均池化操作,全网络中不含全连接层和BN层;
重建网络中,经过高频特征提取网络之后,深层特征图经过一个亚像素卷积层将深层特征图大小变成ground truth的大小,再经过一层数量为3,大小为3×3的卷积层,最后和ground truth进行L1loss函数的计算。
2.根据权利要求1所述的基于深度注意力网络的单幅图像超分辨率重建方法,其特征在于,步骤1中所述预处理具体包括:
首先,利用双三次内插将开源图像训练数据集DIV2K中的ground truth图像进行下采样操作生成低分辨率图像;
然后,对下采样操作生成低分辨率图像进行切块操作,每块图像大小一致;
最后,对切块操作后的图像进行数据增强处理后进行归一化,获得训练集。
3.根据权利要求2所述的基于深度注意力网络的单幅图像超分辨率重建方法,其特征在于,所述数据增强处理为:以百分之五十的概率选中切块操作后的图像进行翻转或旋转处理。
4.根据权利要求2所述的基于深度注意力网络的单幅图像超分辨率重建方法,其特征在于,切块操作设定图像大小为48×48。
5.根据权利要求1所述的基于深度注意力网络的单幅图像超分辨率重建方法,其特征在于,步骤3中训练最大迭代次数为1000次,batch-size为16,初始学习率为0.0001,并设置衰减步数为2e-4,衰减率设置为0.5。
6.基于深度注意力网络的单幅图像超分辨率重建系统,其特征在于,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述权利要求1至5中任一项所述的基于深度注意力网络的单幅图像超分辨率重建方法的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010364389.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种公共服务设施可达性计算方法及装置
- 下一篇:一种环保抑菌塑料袋
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序