[发明专利]一种语义结构一致的图像内容转换方法有效
申请号: | 202010979163.4 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112149802B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 尹梦晓;林振峰;覃子轩;杨锋 | 申请(专利权)人: | 广西大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/80;G06V10/82 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 530004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 结构 一致 图像 内容 转换 方法 | ||
本发明公开了一种语义结构一致的图像内容转换方法,包括步骤:1)收集训练数据,划分源图像和目标图像;2)对训练数据进行预处理,构建转换模型,包括编码器和生成器;3)使用编码器下采样经过预处理的源图像,获取潜在编码;4)使用生成器上采样潜在编码,上采样过程中通过动态感受野自适应融合多尺度信息,生成虚假的目标图像;5)构建判别器,使用虚假的目标图像,经过预处理的源图像和经过预处理的目标图像通过判别器构建损失函数;6)通过训练使损失函数收敛获取参数最优的转换模型,使用转换模型能够转换与训练集中源图像同类的图像。本发明提高了转换模型对图像信息的获取,同时改善了生成器的上采样方式,进一步提升了生成图像的质量。
技术领域
本发明涉及深度学习和图像转换的技术领域,尤其是指一种语义结构一致的图像内容转换方法。
背景技术
计算机视觉领域在深度学习技术的推动下获得飞速发展,图像分类、目标检测和图像生成等方面的技术逐渐成熟,许多研究开始在实际生活中得到应用。在图像生成方面,图像转换能够更准确控制目标图像的生成,对图像的编辑更具有实际意义。而对于图像转换中如何生成高质量的目标图像仍是目前需要解决的问题。
目前多任务的图像转换模型主要分为监督学习和无监督学习,监督学习的转换模型需要成对的训练数据,这些数据中源图像和目标图像要求一一对应且语义结构要求一致,因此需要人为的对这些数据进行标记。由于成对数据存在精确的对应关系,因此监督学习通常能够获得较高质量的生成图像,但仍然存在生成图像模糊和存在伪影等问题。无监督学习的转换模型使用非成对数据,减少了人工标记的成本,但由于数据之间缺乏对应关系,因此需要更复杂的转换模型建立源图像和目标图像之间的关系。通常无监督的转换模型包含多个生成器或生成过程,通过逆向生成建立图像或特征的重构关系,并通过这样的关系优化目标图像的生成。总体而言,监督学习的转换模型利用成对数据的优势能在单一生成器或生成过程中生成相对较高质量的目标图像,简化了模型的训练。无监督学习的转换模型在复杂的生成过程中产生了多样化的结构,包括基于循环一致性约束的结构、基于共享潜在空间的结构和基于特征分离的结构等,这些结构不仅有效利用了非成对数据,其中一些结构还能够根据不同的条件生成多样化的目标图像,但复杂的结构导致了模型训练的困难。无论是监督学习还是无监督学习,转换模型对图像信息的提取仍然有限,导致了生成图像的质量较差。
为了提高图像信息处理的效率,在一些任务中出现了相应的图像信息处理模块,如多尺度信息提取模块和注意力机制模块等,这些模块增强了网络模型对图像信息的获取,提升了网络模型的能力,进一步推动了计算机视觉领域的发展。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种语义结构一致的图像内容转换方法,解决了由于转换模型获取图像信息的能力不足导致的生成图像质量较低和模糊等问题。本发明通过动态感受野自适应融合特征的多尺度信息,改善了转换模型中传统生成器以固定感受野生成图像的形式,同时增强了转换模型获取图像信息的能力,进一步提高了生成图像的质量。
为实现上述目的,本发明所提供的技术方案为:一种语义结构一致的图像内容转换方法,包括以下步骤:
1)收集训练数据,所述训练数据是指成对的图像,包括源图像和目标图像,源图像和目标图像一一对应,语义结构上保持一致;
2)对训练数据进行预处理,构建转换模型,包括编码器和生成器;
3)使用编码器下采样经过预处理的源图像,获取潜在编码;
4)使用生成器上采样潜在编码,上采样过程中通过动态感受野自适应融合多尺度信息,生成虚假的目标图像;
5)构建判别器,使用虚假的目标图像,经过预处理的源图像和经过预处理的目标图像通过判别器构建损失函数;
6)通过训练使损失函数收敛获取参数最优的转换模型,使用参数最优的转换模型能够转换与训练数据中源图像同类的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010979163.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冰箱生产用模具焊接装置
- 下一篇:密封元件、终端设备及密封元件的制作方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序