[发明专利]一种文本指导的自然图像超分辨率重构方法在审
申请号: | 202011263437.6 | 申请日: | 2020-11-12 |
公开(公告)号: | CN114494007A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 颜波;马晨曦;谭伟敏;林青 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/04 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 指导 自然 图像 分辨率 方法 | ||
1.一种文本指导的自然图像超分辨率重构方法,其特征在于,设计一个图像超分辨率重构网络模型,该图像超分辨率重构网络模型包含一个低频网络和一个高频网络,对于n倍超分辨率重构的网络,低频网络和高频网络都分别包括2×log2n个卷积层、log2n个残差块和log2n个去卷积层;每一个残差块包含2个卷积层、1个relu激活层和1个跳跃连接层;低频网络中包括一个文本感知模块,用于将图像特征与文本特征相结合;重构的具体步骤如下:
(1)使用一个文本编码器,从文本描述中提取语义特征t;所述文本编码器是一种循环神经网络;
(2)利用图像超分辨率重构模型,根据文本特征指导生成低频高分辨率图像;具体流程为:
首先,将低分辨率图像ILR输入低频网络,该低频网络用一个卷积层和一个残差块提取低分辨率图像的特征Fim;所述残差块包含2个卷积层、1个relu激活层和1个跳跃连接层;
将低分辨率图像的特征Fim与文本特征t一同输入文本感知模块;该文本感知模块使用1个1×1的卷积层将大小为256×a的文本特征t变为大小为b×a的向量j,将大小为H×W×b的图像特征重新变形为大小为HW×b的向量i;用矩阵乘法将图像向量i和文本向量j相乘得到大小为HW×a的向量k,并将其变形为大小为a×H×W的特征图,作为a个文本感知图Mattn;同时,将向量k与向量j矩阵相乘,并将其变形为大小为H×W×b的特征图,得到特征Fattn;
将特征Fattn与原始图像特征Fim级联后分别输入一个卷积层、一个残差块,接着使用一个去卷积层将特征放大2倍得到Fim2,最后用一个3×3的卷积层输出2倍超分的RGB图像IlowSR×2;
将Fim2与文本特征t输入文本感知模块,得到特征Fattn2;将特征Fattn2与图像特征Fim2级联后分别输入一个卷积层、一个残差块,接着使用一个去卷积层在已经2倍放大的特征的基础上进一步将特征放大2倍得到4倍放大的特征Fim3,最后用一个3×3的卷积层输出4倍超分的RGB图像IlowSR×4;
将Fim3与文本特征t输入文本感知模块,得到特征Fattn3;将特征Fattn3与图像特征Fim3级联后分别输入一个卷积层、一个残差块,接着使用一个去卷积层在已经4倍放大的特征的基础上进一步将特征放大2倍得到8倍放大的特征Fim4,最后用一个3×3的卷积层输出8倍超分的RGB图像IlowSR×8;
低频网络输出不同倍数的低频超分图像{IlowSR×2,IlowSR×4,IlowSR×8};
(3)生成纹理准确的高频高分辨率图像,具体流程为:
将低分辨率图像ILR和低频网络生成的不同尺度的低频超分图像{IlowSR×2,IlowSR×4,IlowSR×8}输入图像超分辨率重构模型的高频网络;该高频网络用一个卷积层和一个残差块提取低分辨率图像特征Fim,再分别使用一个卷积层提取不同尺度的低频超分图像的特征{FlowSR×2,FlowSR×4,FlowSR×8};使用一个去卷积层将Fim放大2倍得到特征FSR×2,将其与FlowSR×2级联,使用一个3×3的卷积层输出2倍超分的高分辨率图像ISR×2;
将特征FSR×2用一个卷积层、一个残差块和一个去卷积层得到在已经放大2倍特征的基础上进一步放大2倍的特征FSR×4;将FSR×4与FlowSR×4级联,使用一个3×3的卷积层输出4倍超分的高分辨率图像ISR×4;
将特征FSR×4用一个卷积层、一个残差块和一个去卷积层得到在已经放大4倍特征的基础上进一步放大2倍的特征FSR×8;将FSR×8与FlowSR×8级联,使用一个3×3的卷积层输出8倍超分的高分辨率图像ISR×8;
高频网络最终生成多个不同放大倍数的图像{ISR×2,ISR×4,ISR×8}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011263437.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序