[发明专利]一种基于生成对抗网络的无监督多模态图像转换方法在审

专利信息
申请号: 202110333549.2 申请日: 2021-03-29
公开(公告)号: CN113160032A 公开(公告)日: 2021-07-23
发明(设计)人: 周乾伟;刘一波;胡海根;李小薪;周晨;陶俊;吴延壮 申请(专利权)人: 浙江工业大学
主分类号: G06T3/00 分类号: G06T3/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 生成 对抗 网络 监督 多模态 图像 转换 方法
【权利要求书】:

1.一种基于生成对抗网络的无监督多模态图像转换方法,其特征在于:所述方法包括以下步骤:

1)输入属于A域的图像xa以及属于B域的图像xb进入图像跨域转换神经网络中进行训练,图像跨域转换神经网络为包含了生成器与判别器的生成对抗网络;

2)编码器将图像拆分编码为图像内容编码c以及域风格编码s;

3)针对不同的域图像配置不同的特定域编码m;

4)将内容编码c、域风格编码s和特定域编码m融合并解码,生成指定目标域图像,若将A域图像xa作为源域,则转换生成B目标域图像xa-→b,若将B域图像xb作为源域,则转换生成A目标域图像xb-→a

5)判别器对生成器生成的图像进行质量评判,区分输入判别器的图像是真实图像或网络生成的假图像;

6)将步骤1)~5)不断重复设定的次数,生成器与判别器不断相互博弈,共同提高性能,直到网络收敛。

2.如权利要求1所述的一种基于生成对抗网络的无监督多模态图像转换方法,其特征在于:使用分配的域特定编码,仅使用一组生成器即可完成其他目标域图像的生成。

3.如权利要求2所述的一种基于生成对抗网络的无监督多模态图像转换方法,其特征在于:使用的域特定编码命名为mi,mi=xi+v,i为一个指定的特定域编号,其中xi为一个具有50*i个元素的向量,且50*i到50*(i+1)-1为元素1,其余位置为元素0;v是一个符合正太分布的高斯噪声,v=N(0,0.2)。

4.如权利要求2或3所述的一种基于生成对抗网络的无监督多模态图像转换方法,其特征在于:所述生成器包含编码器与解码器的结构,编码器对图像进行编码操作,其中包含两个编码器结构:内容编码器,对图像的内容特征进行编码,生成内容编码;风格编码器,对图像的域风格特征进行编码,生成域风格编码;解码器在浅层空间对编码进行AdaIN仿射变换,对变换后的内容编码、域风格编码和特定域编码融合,合成对应的目标域风格图像。

5.如权利要求4所述的一种基于生成对抗网络的无监督多模态图像转换方法,其特征在于:在生成器以及判别器中都引入了注意力机制,设某一层神经网络提取到的特征图的通道数为n,对应的n张特征图用f1、f2…fn表示,引入的注意力机制为:对每个通道的特征图计算其表示重要性的权重,用w1、w2…wn表示,且所有的权重和为1,即将每个通道对应的权重与特征图进行加权求和形成热力图,得到卷积网络的特征可视化结果,即

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110333549.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top