[发明专利]一种多姿态、种类脸部生成方法和装置以及设备在审
申请号: | 202210004165.0 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114429657A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 尚伟艺;邹嘉伟;周勉 | 申请(专利权)人: | 厦门美图之家科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/74;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 程劲竹 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多姿 种类 脸部 生成 方法 装置 以及 设备 | ||
本发明公开了一种多姿态、种类脸部生成方法、装置、设备及存储介质,其包括:获取源图像;生成随机向量,将所述随机向量进行处理,得到所述随机向量对应的风格;将所述风格以及预设的常数矩阵输入预先训练得到的生成网络,得到各种不同姿态的目标图像。能够按照不同姿态、品种的需求对应生成图像,且生成图像具有多样性和丰富性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种多姿态、种类脸部生成方法和装置以及设备。
背景技术
脸部如猫脸、狗脸的检测与识别在诸多现实场景中有广泛的应用。例如在给宠物猫狗拍照或合影的过程中,通过检测出猫狗的五官和轮廓点,可以实时地加入一些贴图控件或文字,以增加拍摄的乐趣。但是由于猫狗脸的一些特性,导致检测和识别任务的困难,从而无法获得多样性的猫狗脸数据集。主要存在以下特性:
(1)猫狗大多活泼好动,导致其姿态和表情多样;
(2)猫狗的种类繁多,一些特殊品种猫狗比较不常见;
(3)颜色各异,即使同品种也有毛色不同的情况;
(4)猫狗脸大多数长毛,不同品种毛发长度不同,也有些不长毛或极短毛,同一只猫狗的毛发长度不同期也可能不同,等等。
发明内容
有鉴于此,本发明的目的在于提出一种多姿态、种类脸部生成方法和装置以及设备,以至少解决相关现有技术中图像数据集不具有多样性的问题。
为实现上述目的,本发明提供一种多姿态、种类脸部生成方法,所述方法包括:
获取源图像;
生成随机向量,将所述随机向量进行处理,得到所述随机向量对应的风格;
将所述风格以及预设的常数矩阵输入预先训练得到的生成网络,得到各种不同姿态的目标图像。
优选的,对所获取的所述源图像进行处理包括:
利用草绘图网络将所述源图像生成对应的草绘图。
优选的,所述将所述随机向量进行处理,得到所述随机向量对应的风格,包括:
将所述随机向量输入解耦网络后所得到的所述随机向量进行仿射变换,得到对应的所述风格。
优选的,所述生成网络的预训练过程,包括:
获取训练图像集,选取N张训练图像,并利用草绘图网络将所述N张训练图像生成对应的目标草绘图,其中,所述训练图像为缺乏姿态或品种的图像,N大于等于1,且N为正整数;
生成第一随机向量,将所述第一随机向量进行处理,得到每个所述第一随机向量对应的第一风格;
将所述第一风格输入生成网络,得到第一输出图像;
根据所述第一输出图像、所述训练图像以及预设的损失函数进行训练,得到所述生成网络。
优选的,所述根据所述第一输出图像、所述训练图像以及预设的损失函数进行训练,得到所述生成网络,包括:
将所述第一输出图像与所述训练图像输入第一判别网络,得到第一判别结果;
将所述第一输出图像通过草绘图网络生成结果草绘图,将所述结果草绘图与所述目标草绘图输入第二判别网络,得到第二判别结果;
基于所述第一输出图像、所述第一判别结果、所述结果草绘图、所述第二判别结果以及预设的损失函数进行训练,得到所述生成网络。
优选的,所述损失函数包括判别真伪损失Lgan以及草绘图损失Lsketch,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司,未经厦门美图之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210004165.0/2.html,转载请声明来源钻瓜专利网。