[发明专利]一种基于文本‑图像生成对抗网络模型的分组卷积方法在审
申请号: | 201711122564.2 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107862377A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 周智恒;李立军;黄俊楚 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 李斌 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 图像 生成 对抗 网络 模型 分组 卷积 方法 | ||
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于文本-图像生成对抗网络模型的分组卷积方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,判别器和生成器对图像进行卷积的操作,都是在同一个GPU上进行的。在这种情况下,整个网络训练所需要的参数规模是巨大的,每次更新参数需要耗费大量的时间,训练的效率较为低下,而本方法采用分组卷积的方式,将卷积的操作在多个GPU上同时进行,最终将各个分组卷积的结果进行融合,从而提高了整个网络训练的效率。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,构建了一种基于文本-图像生成对抗网络模型的分组卷积方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于文本-图像生成对抗网络模型的分组卷积方法,所述的分组卷积方法包括下列步骤:
S1、构造文本-图像生成对抗网络模型,生成器通过生成图像输入至判别器进行网络训练;
S2、利用深度卷积神经网络充当生成器、判别器的功能;
在本发明所涉及到的网络模型中,相对于传统的生成对抗网络模型,多了对于文本内容的编码操作,从而使整个网络能够生成符合文本描述内容的图像。
S3、对文本进行编码之后与随机噪声结合,输入至生成器中;
S4、将卷积层分组,使卷积操作在多个GPU上同时进行;
S5、将各个分组得到的特征图进行融合,更新损失函数,进行后续训练。
进一步地,所述的步骤S2具体如下:
构造多个卷积核,不同的卷积核,代表着在学习的过程中,能够学习到不同的图像特征。
进一步地,所述的步骤S4中将卷积层分组,使卷积操作在多个GPU上同时进行,具体过程如下:
S41、设定卷积的分组数量为N;
S42、将卷积操作分配到N个GPU上同时进行。
进一步地,所述的步骤S5中,将各个分组得到的特征图进行融合,更新损失函数,进行后续训练。具体过程如下:
S51、对S4中卷积之后的特征图,输入判别器进行判别;
S52、将各个分组得到的特征图进行融合,更新损失函数,进行后续训练;
S53、将所有损失函数的均值输入至生成器中继续进行训练。
进一步地,所述的损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
本发明相对于现有技术具有如下的优点及效果:
高效性:本发明根据分组卷积的操作过程,采用分组卷积的方式,将卷积的操作在多个GPU上同时进行,大大减少了网络训练所需要的参数量,最终将各个分组卷积的结果进行融合,从而提高了整个网络训练的效率。
附图说明
图1是本发明中公开的一种基于文本-图像生成对抗网络模型的分组卷积方法的训练流程图;
图2是本发明中将卷积层分组进行卷积的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于文本-图像生成对抗网络模型的分组卷积方法,具体包括下列步骤:
步骤S1、构造文本-图像生成对抗网络模型,生成器通过生成图像输入至判别器进行网络训练。
步骤S2、利用深度卷积神经网络充当生成器、判别器的功能;
不同的卷积核,体现在矩阵数值的不同、行列数的不同。
构造多个卷积核,在处理图像的过程中,不同的卷积核意味着能够在网络训练的过程中学习到生成图像的不同特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711122564.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序