[发明专利]基于cGAN算法的图像超分辨恢复技术在审
申请号: | 201710368897.7 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107274358A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 刘怡俊;刘洋 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T3/40;G06N3/02 |
代理公司: | 广东广信君达律师事务所44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cgan 算法 图像 分辨 恢复 技术 | ||
技术领域
本发明属于计算机图像视觉领域,基于生成深度卷积对抗神经网络图像超分辨恢复。
背景技术
自从2012年AlexNet卷积神经网络横空出世后,神经网络俨然已成为现在learning的主流。比起贝叶斯学派的强先验假设(priori),SVM在核函数(kernel)上的反复钻研,神经网络不需要科研者过多关注细节,只需要提供好海量的数据和设置好超参数,便能达到不错的效果。期刊文献(Goodfellow I J,Pougetabadie J,Mirza M,et al.Generative Adversarial Networks[J].Advances in Neural Information Processing Systems,2014,3:2672-2680.),是GAN的开山之作。GAN原理比较简单,这里以生成图片为例进行说明,GAN包含两个网络:生成器G(Generator)和判别器D(Discriminator)。G是一个生成图片的网络,接收随机噪声z,通过这个噪声生成图片,记做G(z);D是一个判别网络,D是一个判别网络,判别一张图片是不是“真实的”。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率,如果为1,就代表100%是真实的图片,而输出为0,就代表不可能是真实的图片。在训练过程中生成网络G尽量生成目标图像去欺骗判别器D,而判别器D的任务则是将G生成的图像和目标图像分别开来,输出代表真实目标图片的概率。这样G和D构成一个动态的“博弈过程”。最终理想结果就是G可以生成足以“以假乱真”的图片G(z)。对于D来说,它难以判定G生成的图片究竟是不是真实目标的。
相近的实现方案:例如文献1(Dong C,Loy C C,He K,et al.Image Super-Resolution Using Deep Convolutional Networks.[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2016,38(2):295.)中率先提出利用深度学习进行图像的超分辨恢复。该论文中利用三层卷积神经网络,网络输入为灰度的低分辨图像,输出端为对应的高分辨图像,进过大量的训练得到相应的模型再对低分辨图像进行测试从而得到超分辨图像。
文献1的方法中,需要进行大量的训练,并且网络层相对交浅所以训练得到的模型包含的特征权值不够全,所以最后恢复效果并不理想。训练时用的是灰度图,所以对三通道彩色图像的超分辨恢复效果不好。
发明内容
针对现有技术存在的不足,本发明提供对抗神经网络(GAN)图像超分辨率恢复的方法,可以训练彩色图像达到更好的恢复效果。
为实现上述目的,所提出的一种基于cGAN图像超分辨率恢复,包括如下步骤:
(1)制作训练集及图像集。
(2)设计神经网络并进行调整。
(3)进行训练。
(4)得到模型进行测试。
与现有技术相比较,本发明具备以下优点:
(1)训练时间短,由于网络的优越性需要少量的训练次数就可以达到较好的效果;(2)可以直接训练三通道彩色图,采用了三通道训练的接口代码;(3)无需太多的图像预处理,只用讲图像分割成统一大小即可;(4)训练出模型后可以一劳永逸的使用,只需训练出模型然后可以用到很多图像重建的场所如监控设备拍摄的不清晰图像,可以对其进行超分辨恢复来达到更好的显示效果。
附图说明
图1本发明生成器G网络结构图;
图2本发明判别器D网络结构图;
图3本发明方法算法流程图。
具体实施方式
本发明提供了一种基于cGAN图像超分辨率恢复,如图3所示,其包括以下步骤:
(1)制作训练集及图像集。
(2)设计神经网络并进行调整。
(3)进行训练。
(4)得到模型进行测试。
上述1)制作训练集及图像集。具体包括以下步骤:
11)通过python编写代码。
12)下载超分辨研究常用的图像。
13)利用上述代码对图像进行分割成统一的大小。
14)对13)得到的图像进行低分辨处理得到两份图像分别是低分辨和原始高分辨图像。
上述2)设计神经网络并进行调整。具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710368897.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序