[发明专利]视频生成方法及设备在审
| 申请号: | 202111609441.8 | 申请日: | 2021-12-24 |
| 公开(公告)号: | CN114255169A | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 施亦纯;杨骁;沈晓辉 | 申请(专利权)人: | 脸萌有限公司 |
| 主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/50;G06N3/04;G06N3/08;H04N5/262;H04N21/44 |
| 代理公司: | 上海光栅知识产权代理有限公司 31340 | 代理人: | 王慧;马雯雯 |
| 地址: | 英属开曼*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 生成 方法 设备 | ||
1.一种视频生成方法,包括:
在第一图像中,提取第一图像特征;
根据所述第一图像特征和第二图像特征,通过非线性插值得到多个中间图像特征,所述第二图像特征为第二图像的图像特征;
基于所述第一图像特征、所述第二图像特征和所述多个中间图像特征,通过图像生成模型进行图像重建,生成目标视频,其中,所述目标视频用于展现从所述第一图像渐变至所述第二图像的过程。
2.根据权利要求1所述的视频生成方法,所述根据所述第一图像特征和第二图像特征,通过非线性插值,得到多个中间图像特征,包括:
根据所述第一图像特征和所述第二图像特征,生成第三图像特征;
依次基于所述图像生成模型的特征空间和神经网络,调整所述第三图像特征,所述神经网络用于学习基于所述特征空间进行图像特征调整的偏差;
根据所述第一图像特征、所述第二图像特征和调整后的第三图像特征,进行非线性插值,得到所述多个中间图像特征。
3.根据权利要求2所述的视频生成方法,所述依次基于所述图像生成模型的特征空间和神经网络,调整所述第三图像特征,所述神经网络用于学习基于所述特征空间进行图像特征调整的偏差,包括:
获取所述特征空间中的平均图像特征;
根据所述平均图像特征,对所述第三图像特征进行初步调整;
将所述第一图像特征和所述第二图像特征,输入所述神经网络,得到所述神经网络的输出数据,所述输出数据反映所述初步调整的偏差;
根据所述输出数据,对初步调整后的第三图像特征进行再次调整。
4.根据权利要求3所述的视频生成方法,所述根据所述平均图像特征,对所述第三图像特征进行初步调整,包括:
确定所述第三图像特征与所述平均图像特征的均值;
确定所述初步调整后的第三图像特征为所述均值。
5.根据权利要求2至4任一项所述的视频生成方法,所述神经网络基于正则约束和相似度约束训练得到,所述正则约束用于最小化基于所述神经网络调整后的图像特征与基于所述特征空间调整后的图像特征之间的差异,所述相似度约束用于最小化基于所述神经网络调整后的图像特征与第一训练图像的图像特征、第二训练图像的图像特征之间的差异。
6.根据权利要求2至4任一项所述的视频生成方法,所述基于所述第一图像特征、所述第二图像特征和所述第三图像特征,进行非线性插值,得到所述多个中间图像特征,包括:
根据所述第一图像特征、所述第二图像特征和所述第三图像特征,通过三次样条插值得到插值曲线;
在所述插值曲线上进行采样,得到所述多个中间图像特征。
7.根据权利要求2至4任一项所述的视频生成方法,所述图像生成模型为StyleGAN模型或者StyleGAN2模型。
8.一种模型确定方法,包括:
根据多个训练图像和图像生成模型,训练神经网络,所述神经网络用于学习基于所述图像生成模型的特征空间进行图像特征调整的偏差;
其中,所述神经网络的一次训练过程包括:
根据第一训练图像的图像特征和第二训练图像的图像特征,生成目标图像特征;
基于所述特征空间,对所述目标图像特征进行初步调整;
通过所述神经网络学习所述初步调整对应的目标偏差,并根据所述目标偏差,对初步调整后的目标图像特征进行再次调整;
根据所述目标偏差、再次调整后的目标图像特征、所述第一训练图像和所述第二训练图像,调整所述神经网络的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸萌有限公司,未经脸萌有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111609441.8/1.html,转载请声明来源钻瓜专利网。





