[发明专利]灵活多样的人脸图像老化生成系统在审
申请号: | 202310338136.2 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116342379A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 李佩佩;何召锋;王锐;曹春水 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T3/40;G06V20/70;G06V40/16;G06N3/0455;G06N3/08 |
代理公司: | 石家庄领皓专利代理有限公司 13130 | 代理人: | 郭红伟 |
地址: | 100089 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 灵活 多样 图像 老化 生成 系统 | ||
本发明涉及图像处理技术领域,提出了灵活多样的人脸图像老化生成系统,包括获得单元,用于获得原始输入图像参考图像和预先定义的老化文本tsupgt;ref/supgt;;CLIP编码器,用于将所述参考图像和所述老化文本tsupgt;ref/supgt;映射到CLIP隐空间,分别得到隐向量esupgt;img/supgt;和隐向量esupgt;txt/supgt;;概率年龄预测单元,用文本先验N(esupgt;txt/supgt;,I)做KL散度约束,根据隐向量esupgt;img/supgt;得到老化条件的概率生成表示esupgt;age/supgt;=N(μsubgt;φ/subgt;(esupgt;img/supgt;),σsubgt;φ/subgt;supgt;2/supgt;(esupgt;img/supgt;)I);扩散自编码器,用于将原始输入图像编码成语义条件第一扩散解码器,用于将语义条件zsupgt;src/supgt;、预训练扩散自编码器中扩散第t步的加噪图像和老化条件esupgt;age/supgt;解码解成去噪老化编辑后的图像p。通过上述技术方案,解决了现有技术中人脸老化灵活程度低的问题。
技术领域
本发明涉及图像处理技术领域,具体的,涉及灵活多样的人脸图像老化生成系统。
背景技术
人脸老化旨在保持人脸身份信息的同时,模拟不同年龄段的面部外观变化,在年龄估计、跨年龄人脸识别、影视创作以及医美等方面有实际的落地应用前景。在过去的几十年里,深度学习的快速发展推动了人脸老化的研究工作。目前人脸老化主要面临三个问题:首先,之前基于GAN的方法往往很难鲁棒地生成高质量的老化结果,在实际生成过程中很多结果存在明显伪影;其次,之前的老化方法往往以固定的年龄标签作为输入,大大限制了人脸老化的灵活程度;最后,之前的老化方法忽略老化的多样性,因为受到环境等复杂因素的影响,只生成一种老化模式是很不科学的。总结来说,上述三个问题都是老化中亟待解决的问题。
发明内容
本发明提出灵活多样的人脸图像老化生成系统,解决了相关技术中人脸老化灵活程度低的问题。
本发明的技术方案如下:包括:
获得单元,用于获得原始输入图像参考图像和预先定义的老化文本tref;
CLIP编码器,用于将所述参考图像和所述老化文本tref映射到CLIP隐空间,分别得到隐向量eimg和隐向量etxt;
概率年龄预测单元,用文本先验N(etxt,I)做KL散度约束,根据隐向量eimg得到老化条件的概率生成表示eage=N(μφ(eimg),σφ2(eimg)I);其中N(0,I)表示正态分布,μφ表示正态分布的均值,σφ表示正态分布的方差,φ为网络参数;
扩散自编码器,用于将原始输入图像编码成语义条件
第一扩散解码器,用于将语义条件zsrc、预训练扩散自编码器中扩散第t步的加噪图像和老化条件eage解码解成去噪老化编辑后的图像p。
本发明的工作原理及有益效果为:
由于图像和文字作为老化条件更符合人类的直觉和认知,本发明首先将参考图像和预先定义的老化文本tref经过预训练CLIP编码器映射到CLIP隐空间,分别得到相应表示为eimg和etxt,利用CLIP隐空间文本和图像的高度一致对齐的特性;然后将老化条件视为从概率分布中的采样结果,并用文本先验做KL散度约束,对老化条件eage做概率生成表示,实现图像和文本灵活交互的老化条件生成。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310338136.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序