[发明专利]图像生成方法及装置在审
| 申请号: | 202111006421.1 | 申请日: | 2021-08-30 |
| 公开(公告)号: | CN114037640A | 公开(公告)日: | 2022-02-11 |
| 发明(设计)人: | 蒋敏;蒋子平;王云鹏 | 申请(专利权)人: | 华为技术有限公司;兰卡斯特大学 |
| 主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T11/00;G06T5/00;G06N3/08;G06N3/04 |
| 代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 生成 方法 装置 | ||
本申请公开了一种图像生成方法,该图像生成方法包括:确定源图像的第一语义目标图像,所述第一语义目标图像为所述源图像包含的至少一个语义目标图像中的至少一个;根据所述第一语义目标图像和第一先验分布确定目标图像,所述第一先验分布为第一背景图像和待生成语义目标信息的噪声的先验分布,所述目标图像包括多种包含所述待生成语义目标信息的图像,所述待生成语义目标信息包括待生成语义目标图像的标签和待生成语义目标图像的指示信息,所述第一背景图像为所述源图像的背景图像。从而能够针对特定样本图片集中包含的多语义目标图像实现自动生成质量稳定并且多样性的目标图片集。
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像生成方法及装置。
背景技术
目前,图像生成技术在计算机视觉领域的应用越来越广泛,可以广泛应用于工业自动化、生物医药、汽车等领域,例如,自动驾驶、智能检测以及视频监控等。
现有技术中,通过深度神经网络模型强大的计算能力可以有效进行图像数据的处理。例如,通过判别类模型可以对给定的已知输入预测其未知的属性,即,识别给定图片所述类型以及检测图片中存在的所有语义目标;通过生成类模型可以对数据的分布进行模型构建,描述可观测的数据集,从而生成与之具有相同分布的数据。结合当前的判别模型和生成模型可以实现不同类别的图像的相互转换。
当前的生成模型极大的启发了关于生成大型复杂场景图片的研究,例如,条件生成对抗网络(conditional generative adversarial nets,cGAN)。但一方面,当前的生成模型在实现之前所需的人工成本不可忽视,例如,需要准备足够数量的原始图片集与目标图片集,并对其中的语义目标进行人工标注;另一方面,在复杂场景下仅能生成针对单一语义目标的图片,并且生成的图片质量欠佳,例如,语义目标细节与图像纹理缺失,导致图片严重失真,甚至部分语义目标缺失。
如何针对少量样本图片集中包含的多语义目标图片实现自动生成质量稳定并且多样性的目标图片集,成为业界亟需解决的问题。
发明内容
本申请提供一种图像生成方法及装置,能够针对少量样本图片集中包含的多语义目标图像实现自动生成质量稳定并且多样性的目标图片集。
第一方面,提供了一种图像生成方法,该方法包括:确定源图像的第一语义目标图像,该第一语义目标图像为该源图像包含的至少一个语义目标图像中的至少一个;根据该第一语义目标图像和第一先验分布确定目标图像,该第一先验分布为根据第一背景图像和待生成语义目标信息得到的噪声的先验分布,该目标图像包括多种包含待生成语义目标信息的图像,该待生成语义目标信息包括待生成语义目标图像的标签和待生成语义目标图像的指示信息,该第一背景图像为上述源图像的背景图像。
根据本申请提供的上述方案,基于源图像的背景图像和待生成的语义目标图像的信息生成先验分布,根据该先验分布进行随机抽样可以生成待生成的语义目标图像在第一背景图像的多样性分布并且符合全图纹理的目标图像。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:该根据第一语义目标图像和第一先验分布确定目标图像,包括:根据该第一语义目标图像确定该第一背景图像;根据该第一背景图像和该待生成语义目标信息生成该第一先验分布;根据该第一先验分布和该第一背景图像生成该目标图像。
根据上述技术方案,生成模块根据第一语义目标图像来确定第一背景图像的区域,进一步确定第一背景图像的特征,根据第一背景图像特征和待生成的语义目标生成第一先验分布,从而确保生成的图像能够符合全图纹理,避免图像失真,并且基于第一背景图像特征生成的待生成的语义目标的先验分布可以使得后续的抽样具有多样性,从而保障目标图像的多样性。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:该根据该第一先验分布和该第一背景图像生成该目标图像,包括:根据该第一先验分布生成该待生成语义目标图像的噪声;根据该待生成语义目标图像的噪声和该第一背景图像生成该目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;兰卡斯特大学,未经华为技术有限公司;兰卡斯特大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111006421.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





