[发明专利]一种基于WGAN模型的图像通道融合方法在审
申请号: | 201810101708.4 | 申请日: | 2018-02-01 |
公开(公告)号: | CN108399422A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 周智恒;李立军 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 生成器 卷积 图像通道 网络模型 学习神经网络 图像 随机噪声 损失函数 训练模型 原始生成 整个网络 对抗 初始化 鲁棒性 判别器 特征图 构建 评判 图片 | ||
本发明公开了一种基于WGAN模型的图像通道融合方法,属于深度学习神经网络领域,包括以下步骤:S1、构造原始生成对抗网络模型;S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;S3、初始化随机噪声,输入生成器中;S4、在WGAN模型中利用通道融合对图像进行卷积操作;S5、将通道融合操作得到的损失函数输入生成器进行后续训练。本方法构建的基于通道融合的WGAN模型,改变了判别器、生成器接收图片后的卷积方式,在每次卷积之后都对图像各个通道的特征图进行融合,从而能够提高整个网络训练模型的鲁棒性。
技术领域
本发明涉及深度学习神经网络,具体涉及一种基于WGAN模型的图像通道融合方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,因此,需要本领域技术人员选取一种合理的参数作为生成对抗网络的评判指标,可以使得整个模型的训练能够往正确的方向进行,同时,亟待提出一种特征融合方法,提高深度学习神经网络的鲁棒性。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于WGAN模型的图像通道融合方法,该方法利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行,另外利用通道融合学习图像特征的方法,在每一层卷积之后都对图像各个通道的特征图进行融合,提高了整个网络的鲁棒性。
本发明的目的可以通过采取如下技术方案达到:
一种基于WGAN模型的图像通道融合方法,所述的图像通道融合方法包括以下步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像并输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
S3、初始化随机噪声,输入生成器中;
S4、在WGAN模型中利用通道融合对图像进行卷积操作;
S5、将通道融合操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S4过程如下:
S41、将图像分解成多个通道;
S42、针对图像的各个通道,利用不同的卷积核进行卷积;
S43、在每一层卷积完成之后,对所有通道的特征图融合。
进一步地,所述的步骤S5过程如下:
S51、将步骤S4中卷积之后的特征图,输入判别器进行判别;
S52、将通道融合操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度。
本发明相对于现有技术具有如下的优点及效果:
1、在传统的模型中,图像各个通道的特征图经过多层卷积之后才进行融合,本方法采用了通道融合的方法,在每一层卷积结束之后,都对图像各个通道的特征图进行融合,再进行后续训练。在这种情况下,整个网络的鲁棒性得到了进一步增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810101708.4/2.html,转载请声明来源钻瓜专利网。