[发明专利]一种基于知识蒸馏的图像超分辨率增强方法有效

专利信息
申请号: 201810603516.3 申请日: 2018-06-12
公开(公告)号: CN108830813B 公开(公告)日: 2021-11-09
发明(设计)人: 高钦泉;赵岩;童同 申请(专利权)人: 福建帝视信息科技有限公司
主分类号: G06T5/00 分类号: G06T5/00;G06T3/40;G06T7/90;G06N3/04
代理公司: 福州君诚知识产权代理有限公司 35211 代理人: 戴雨君
地址: 350000 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 蒸馏 图像 分辨率 增强 方法
【权利要求书】:

1.一种基于知识蒸馏的图像超分辨率增强方法,其特征在于:其包括以下步骤:

1)训练数据和测试数据的获取;

1-1)训练集选择DIV2K和Flickr2K,一共包括3450张真实图像,测试集分别选择了国际公开数据集Set5、Set14、BSDS100、Urban100;

1-2)采用Bicubic下采样的方法,将训练集的真实图像进行3倍下采样,得到与其对应的一组低分辨率图像;

1-3)使用opencv库中的imread()函数分别读取真实图像和低分辨率图像,图像格式为BGR数据,BGR分别代表彩色空间的蓝色、绿色以及红色部分,

1-4)然后将BGR空间的图像转换到YCrCb空间,Y代表明亮度,即灰阶值,Cr代表BGR红色部分与BGR信号亮度值之间的差异,Cb代表BGR蓝色部分与BGR信号亮度值之间的差异;

1-5)对YCrCb空间的图像进行通道分离,只选择Y通道数据进行训练,并对Y通道数据进行归一化处理;

1-6)对Y通道图像进行裁剪,将裁剪过后的真实图像块作为训练目标,将裁剪过后的低分辨率图像块作为网络训练时的输入,每一次迭代所需的训练数据为32对;

2)教师网络的训练;教师网络拥有较深卷积层的神经网络模型,

2-1)教师网络的第一层为特征提取和表示层,由卷积层和非线性激活层组成,非线性激活层选择ReLU作为激活函数,第一层的操作可用如下公式表示:F1(X)=max(0,W1*X+b1)式中,W1,b1分别为第一层卷积层的权重和偏置,“*”表示卷积操作,ReLU函数的定义为max(0,x);

2-2)教师网络的中间层由10个残差块组成,每个残差块有两个卷积层,每个卷积层后是激活函数为ReLU的非线性激活层;用一个跳跃连接将第一个卷积层的输入和第二个卷积层的输出相加,仅对第一个卷积层的输入进行残差学习;每一个残差块用如下公式表示:

F2o+1(X)=max(0,W2o+1*Fo(X)+b2o+1)+F2o-1(X)(1≤o≤10)

式中,o代表残差块序号,Fo(X)代表残差块中第一个卷积层和非线性激活层的输出,W2o+1和b2o+1分别代表残差块中第二个卷积层的权重和偏置,F2o-1(X)代表残差块的输入;

2-3)教师网络的重构层是反卷积层,反卷积层用于将前一层网络的输出进行上采样,使输出的超分辨率图像与训练目标大小相等;

2-4)对于教师网络的训练,学习率设置为0.0001,使用MSE函数作为训练目标和网络输出的损失函数,其表达式如下所示:式中,n为训练样本数量,Yi为输入图像,Y′i为预测图像;

2-5)使用Adam优化方法使损失函数最小化;

3)学生网络的训练;

3-1)学生网络的第一层为特征提取和表示层,其参数设置与教师网络的第一层相同;

3-2)学生网络的中间层由3个深度可分离卷积模块组成,每个模块都是由一个3×3的深度级卷积层和一个1×1的卷积层组成,深度级卷积层和卷积层后都是一个激活函数为ReLU的非线性激活层,深度级卷积的操作由如下公式表示:

式中,K是大小为Dk×Dk×M的深度卷积核,将K中的第m个滤波器应用于F的第m个特征图,来产生经滤波的输出特征图G的第m个特征图;

3-3)学生网络重构层的参数设置与教师网络的重构层相同;

3-4)学生网络的学习率,损失函数,优化方法与教师网络相同;即学习率设置为0.0001,使用MSE函数作为训练目标和网络输出的损失函数,其表达式如下所示:式中,n为训练样本数量;

4)教师网络对学生网络的指导学习;通过三组指导实验由学生网络学习吸收教师网路的特征图;

5)测试评估图像重建效果;

6)根据输出特征图之间不同的矩阵关系对学生网络进行进一步指导;

设卷积神经网络的激活层的输出张量为A∈RC×H×W,式中C为特征图个数,H和W分别为特征图的高和宽,

函数M将张量A作为输入,输出为二维矩阵,即:M:RC×H×W→RH×W,且输出特征图之间满足以下关系:

特征图均值的p次方:

特征图p次方的均值:

特征图的最大值:Mmax(A)=maxi=1,CAi

特征图的最小值:Mmin(A)=mini=1,CAi

式中,M为函数,p为幂次方系数,A为卷积神经网络的激活层的输出张量,C为特征图个数,i为特征图序号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建帝视信息科技有限公司,未经福建帝视信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810603516.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top