[发明专利]一种视频生成方法及相关装置有效
申请号: | 202010480675.6 | 申请日: | 2020-05-30 |
公开(公告)号: | CN111669515B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 邵滨;岳俊;钱莉;许松岑;黄雪妍;刘亚娇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N5/265 | 分类号: | H04N5/265;H04L12/58;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 生成 方法 相关 装置 | ||
1.一种视频生成方法,其特征在于,包括:
接收视频生成指令,并响应于所述视频生成指令从用户偏好信息、用户生理数据信息、当前环境信息中的一个或多个获取文本信息,以及响应于所述视频生成指令获取图片信息,所述当前环境信息包括当前天气信息、当前时间信息、当前地理位置信息中的一个或多个,所述文本信息包括一个或多个关键字,所述图片信息包括N张图片,N为大于或等于1的正整数;
根据所述一个或多个关键字获取所述N张图片中与所述一个或多个关键字对应的图像特征;
将所述一个或多个关键字和所述N张图片的图像特征输入目标生成器网络中,生成目标视频,所述目标视频包括M张图片,所述M张图片为基于所述图像特征生成的、且与所述一个或多个关键字对应的图片,M为大于1的正整数。
2.根据权利要求1所述方法,其特征在于,所述响应于所述视频生成指令获取图片信息,包括:
响应于所述视频生成指令,从预先存储的多张图片中,获取与所述一个或多个关键字中至少一个关键字对应的图片。
3.根据权利要求1所述方法,其特征在于,所述视频生成指令包括人脸识别请求;所述响应于所述视频生成指令获取图片信息,包括:
响应于所述视频生成指令,进行人脸识别并获得人脸识别结果;
根据所述人脸识别结果,从预先存储的多张图片中,获取与所述人脸识别结果匹配的至少一张图片。
4.根据权利要求1所述方法,其特征在于,所述视频生成指令包括至少一个图片标签,所述至少一个图片标签中每一个图片标签与预先存储的多张图片中的至少一张图片对应;所述响应于所述视频生成指令获取图片信息,包括:
响应于所述视频生成指令,根据所述至少一个图片标签,从预先存储的多张图片中,获取与所述至少一个图片标签中每一个图片标签对应的至少一张图片。
5.根据权利要求2-4所述的任意一项方法,其特征在于,所述获取的所述N张图片中每张图片的图片质量均大于预设阈值。
6.根据权利要求1-4所述的任意一项方法,其特征在于,所述方法还包括:
将获取的所述N张图片进行图片质量评分,获得所述N张图片中每张图片对应的图片质量评分结果;
将所述图片质量评分结果小于预设阈值的图片进行图片质量增强处理,并将图片质量增强后的图片更新至所述N张图片中。
7.根据权利要求6所述方法,其特征在于,所述将所述一个或多个关键字和所述N张图片的图像特征输入目标生成器网络中,生成目标视频,包括:
提取所述一个或多个关键字中每一个关键字在向量空间上对应的第一空间变量;
提取所述N张图片的图像特征分别在向量空间上对应的第二空间变量;
将所述第一空间变量和所述第二空间变量输入所述目标生成器网络中,生成所述目标视频。
8.根据权利要求7所述方法,其特征在于,所述方法还包括:
获取样本文本信息、样本图片信息以及真实视频数据集,并构建判别器网络和基于视频生成的生成器网络;
将所述样本文本信息和所述样本图片信息输入所述生成器网络中,生成样本视频;
将所述样本视频和所述真实视频数据集作为所述判别器网络的输入,获得判别损失结果,其中,在所述样本视频属于所述真实视频数据集时,所述判别损失结果为1;
根据所述判别损失结果,训练所述生成器网络获得所述目标生成器网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010480675.6/1.html,转载请声明来源钻瓜专利网。