[发明专利]基于深度学习的时间维视频超分辨率方法在审
申请号: | 201710341864.3 | 申请日: | 2017-05-16 |
公开(公告)号: | CN107133919A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 董伟生;巨丹;石光明;谢雪梅;吴金建;李甫 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;H04N19/587;G06N3/08;G06N3/04 |
代理公司: | 陕西电子工业专利中心61205 | 代理人: | 王品华,朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 时间 视频 分辨率 方法 | ||
1.基于深度学习的时间维视频超分辨率方法,包括:
(1)将彩色视频图像集S={S1,S2,...,Si,...,SN}转换为灰度视频图像集,即原始视频图像集X={X1,X2,...,Xi,...,XN},并利用下采样矩阵F对原始视频图像集X进行直接下采样,得到下采样视频图像集Y={Y1,Y2,...,Yi,...,YN},其中,表示第i个原始视频图像样本,表示第i个下采样视频图像样本,1≤i≤N,N表示原始视频图像集中图像样本的数量,M表示原始视频图像块的大小,Lh表示原始视频图像集每个样本中图像块的数量,Ll表示下采样视频图像集每个样本中图像块的数量,且Lh=r×Ll,r表示原始视频图像集对下采样视频图像集的放大倍数;
(2)构建神经网络模型,并利用下采样视频图像集Y和原始视频图像集X训练神经网络参数:
(2a)确定神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数量,随机初始化各层的连接权值W(t)和偏置b(t),给定学习速率η,选定激活函数为:其中,g表示神经网络节点的输入值,t=1,2,…,n,n表示神经网络的总层数;
(2b)随机输入下采样视频图像集中的一个下采样视频图像Yi作为输入训练样本,同时输入对应的原始视频图像集中的一个原始视频图像Xi作为输出训练样本,使用选定的激活函数计算神经网络每一层的激活值,计算得到:
第1层即输入层的激活值为:a(1)=Yi,
第t'=2,3,...,n层的激活值为:a(t′)=f(W(t′-1)*a(t′-1)+b(t′-1)),其中,在该网络的第二层,第三层,第四层即t'=2,t'=3,t'=4时,为了充分提取视频帧间的相关性,设计了三个三维滤波器用来代替传统的二维滤波器,f(g)表示tanh(g)激活函数,g=W(t′-1)*a(t′-1)+b(t′-1),W(t′-1)和b(t′-1)分别表示第t'-1层的权重和偏置,a(t′-1)表示第t'-1层的激活值;
(2c)计算神经网络各层的学习误差:
输出层即第n层的误差为:δ(n)=Xi-a(n),
第t"=n-1,n-2,...,2层的误差为:δ(t′)=((W(t”))Tδ(t”+1)).*f'(W(t”-1)*a(t”-1)+b(t”-1)),其中,W(t”)表示第t"层的权值,δ(t″+1)表示第t"+1层的误差,W(t”-1)和b(t”-1)分别表示第t"-1层的权值和偏置,a(t”-1)表示第t"-1层的激活值,f'(g')表示函数f(g')的导数,(g”)T表示转置变换,g'=W(t”-1)*a(t”-1)+b(t”-1),g”=W(t”);
(2d)按误差梯度下降方法更新神经网络各层的权值和偏置:
将权值更新为W(t)=W(t)-ηδ(t+1)(a(t))T,将偏置更新为b(t)=b(t)-ηδ(t+1),其中,δ(t+1)表示第t+1层的误差,a(t)表示第t层的激活值;
(2e)反复执行步骤(2b)-(2d),直到神经网络的输出层误差达到预设精度要求或训练次数达到最大迭代次数,结束训练,保存网络结构和参数,得到训练好的神经网络模型;
(3)任给一段视频,输入到训练好的神经网络模型中,神经网络的输出即为时间维超分辨后的视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710341864.3/1.html,转载请声明来源钻瓜专利网。