[发明专利]一种文本到图像的方法有效
申请号: | 201911033265.0 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110866958B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 袁春;吴航昊;贲有成 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06N3/0455;G06N3/0464;G06N3/0475 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 方法 | ||
1.一种文本生成图像的方法,其特征在于,包括如下步骤:
S1:训练对抗视觉语义嵌入模型,所述对抗视觉语义嵌入模型包括:图像编码器网络,图像解码器网络,生成器网络和与所述生成器网络配对的判别器网络;
训练所述对抗视觉语义嵌入模型包括如下步骤:
S11:构建对抗视觉语义嵌入模型;
S12:应用重构损失函数训练所述图像编码器网络和所述图像解码器网络;
S13:应用所述重构损失函数训练所述生成器网络和所述解码器网络;
S14:应用沃瑟斯坦距离作为损失函数训练所述生成器网络和所述判别器网;
S2:将文本输入所述生成器网络,所述生成器网络输出文本特征嵌入;
S3:将所述文本特征嵌入输入到所述解码器网络,所述解码器网络输出符合所述文本的语义描述的图像。
2.如权利要求1所述的文本生成图像的方法,其特征在于,所述重构损失函数为:
;
其中,表示所述图像编码器网络,表示所述图像解码器网络,Z表示Encoder提取的特征,x表示训练图像样本,表示KL散度,是先验分布,表示期望,表示当输入为训练图像样本x时图像编码器网络Enc输出的Encoder提取的特征z,表示当输入为特征z时图像解码器网络Dec输出的训练图像样本x。
3.如权利要求2所述的文本生成图像的方法,其特征在于,在所述重构损失函数中加入感知损失。
4.如权利要求1所述的文本生成图像的方法,其特征在于,所述沃瑟斯坦距离为:
;
其中,为所述生成器网络,为所述判别器网络,为从标准高斯分布中采样出的100维的噪声,为训练图像样本,t为训练集文本描述,表示一阶李普希斯连续,Pdata为训练集图片的概率分布,为期望,表示一阶李普希斯连续限制下的上确界,表示训练集图片的概率分布Pdata的训练图像样本x的期望,表示当输入为图像样本x时图像编码器网络Enc输出的Encoder提取的特征,表示判别器网络对图像编码器网络的输出的判别结果,表示噪声nz服从标准正态分布时的期望,表示当输入文本为t和噪声为nz时生成器网络的输出,表示判别器网络对生成器网络的输出的判别结果。
5.如权利要求1所述的文本生成图像的方法,其特征在于,还包括如下步骤:
S4:构造一个新的判别器网络,所述新的判别器网络用于判别所述解码器网络输出的所述图像与训练集中的图像。
6.如权利要求1-5任一所述的文本生成图像的方法,其特征在于,所述编码器网络采用Resnet101的卷积层,在所述卷积层后追加两个全连接层;
所述解码器网络是与Resnet101对称的反卷积网络;
所述生成器网络是GAN-INT-CLS的通道卷积网络;
所述判别器网络是卷积网络。
7.如权利要求1-5任一所述的文本生成图像的方法,其特征在于,采用谱归一化方式来约束所述判别器网络。
8.如权利要求1-5任一所述的文本生成图像的方法,其特征在于,所述生成器网络与所述编码器网络的输出格式相同。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911033265.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序