[发明专利]美漫风格的头像生成模型的训练、生成方法及电子设备在审
申请号: | 202211055003.6 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115393181A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 程平;吴松城 | 申请(专利权)人: | 厦门黑镜科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V40/16;G06N20/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张琳琳 |
地址: | 361000 福建省厦门市火炬高*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风格 头像 生成 模型 训练 方法 电子设备 | ||
本发明涉及图像处理技术领域,具体涉及美漫风格的头像生成模型的训练、生成方法及电子设备,训练方法包括获取样本图像对,样本图像对包括真实头像以及对应的卡通头像;将真实头像输入头像生成模型的特征编码模块中,确定特征编码;将特征编码输入头像生成模型的头像风格生成模块中,确定预测卡通头像,头像风格生成模块是预训练得到的;检测卡通头像与预测卡通头像的人脸关键点,并确定人脸关键点损失;基于卡通头像与预设卡通头像的差异,确定图像转换损失;根据人脸关键点损失与图像转换损失的融合结果,对特征编码模块的参数进行更新,以确定目标头像生成模型。该方法增加了目标一致性的考察维度,在图像转换中,更快的收敛到目标效果。
技术领域
本发明涉及图像处理技术领域,具体涉及美漫风格的头像生成模型的训练、生成方法及电子设备。
背景技术
现有的头像生成模型可以随机生成图片,例如,人脸,动漫等,通过人工神经网络可以得到一个从离散的隐空间到人脸图像的生成器。其中,隐空间指原始数据经过压缩或编码后的数据(即特征向量)所在的空间。但是,对真实人脸图像进行编辑时,首先需要把图像投射到潜空间生成隐码,然后再基于进行人脸重建,但重建的过程不但耗时且效果不理想。
发明内容
有鉴于此,本发明实施例提供了一种美漫风格的头像生成模型的训练、生成方法及电子设备,以解决生成头像的效率较低且效果不理想的问题。
根据第一方面,本发明实施例提供了一种美漫风格的头像生成模型的训练方法,包括:
获取样本图像对,所述样本图像对包括真实头像以及对应的卡通头像;
将所述真实头像输入头像生成模型的特征编码模块中,确定特征编码;
将所述特征编码输入所述头像生成模型的头像风格生成模块中,确定预测卡通头像,所述头像风格生成模块是预训练得到的;
检测所述卡通头像与所述预测卡通头像的人脸关键点,并确定人脸关键点损失;
基于所述卡通头像与所述预设卡通头像的差异,确定图像转换损失;
根据所述人脸关键点损失与所述图像转换损失的融合结果,对所述特征编码模块的参数进行更新,以确定目标头像生成模型。
本发明实施例提供的美漫风格的头像生成模型的训练方法,在损失函数的设计中,增加了人脸关键点损失,相应地,增加了目标一致性的考察维度,在图像转换中,更快的收敛到目标效果,提高了训练效率及所得到的目标头像生成模型的准确性;同时,由于在训练过程中采用的是预训练得到的头像风格生成模块,减少了模型训练所用的时长。
在一些实施方式中,所述根据所述人脸关键点损失与所述图像转换损失的融合结果,对所述特征编码模块的参数进行更新,以确定目标头像生成模型,包括:
获取多组权重组合,所述权重组合中包括与所述人脸关键点损失与所述图像转换损失一一对应的权重;
对于各个所述权重组合,对所述人脸关键点损失与所述图像转换损失进行融合,得到对应的综合损失;
利用所述综合损失对所述特征编码模块的参数进行更新,得到可选头像生成模型;
基于所述可选头像生成模型的训练效果,从所述可选头像生成模型中确定所述目标头像生成模型,所述训练效果包括训练时长以及所述可选头像生成模型的精准度中的至少一种。
本发明实施例提供的美漫风格的头像生成模型的训练方法,在训练过程中对人脸关键点损失以及图像转换损失进行融合时,采用的是多组权重组合的方式进行融合,即,采用多组不同的权重进行融合,最终利用各组权重组合所得到的可选头像生成模型的训练效果确定出目标头像生成模型,提高了目标头像生成模型的准确性。
在一些实施方式中,所述获取多组权重组合,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门黑镜科技有限公司,未经厦门黑镜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211055003.6/2.html,转载请声明来源钻瓜专利网。