[发明专利]视频生成方法、装置、电子设备以及存储介质在审
申请号: | 202210097018.2 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114429767A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 刘玉强;耿凡禺;彭哲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G06V40/20;G10L15/02;G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴晓兵 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 电子设备 以及 存储 介质 | ||
1.一种视频生成方法,包括:
确定与语音特征序列对应的唇形特征序列,其中,所述语音特征序列是从待生成视频的语音数据中提取的;
基于所述唇形特征序列,从多个模板唇动参数中确定目标模板唇动参数序列,其中,所述多个模板唇动参数是从包括真实唇动的视频中提取得到的;
基于所述目标模板唇动参数序列,生成目标对象的初始形象序列;以及
对所述目标对象的初始形象序列进行时域渲染处理,得到所述目标对象的目标形象序列。
2.根据权利要求1所述的方法,还包括:
基于所述待生成视频的语音数据,确定目标表情类型信息;以及
基于所述目标表情类型信息,从表情映射关系中的多个模板表情参数中确定目标模板表情参数序列,其中,所述表情映射关系表征了所述多个模板表情参数和多个表情类型信息之间的映射关系,所述多个模板表情参数是从包括真实表情的视频中提取得到的。
3.根据权利要求2所述的方法,其中,所述基于所述目标模板唇动参数序列,生成目标对象的初始形象序列包括:
确定所述目标对象的形象参数信息,其中,所述形象参数信息包括以下至少一项:头部姿态信息、脸部网格信息、脸部纹理信息、光照参数信息;
对所述目标模板表情参数序列和所述目标模板唇动参数序列进行融合处理,得到表情融合的唇动参数序列;以及
基于所述表情融合的唇动参数序列和所述形象参数信息,生成目标对象的初始形象序列。
4.根据权利要求1至3中任一项所述的方法,其中,所述基于所述唇形特征序列,从多个模板唇动参数中确定目标模板唇动参数序列包括:
针对所述唇形特征序列中的每个唇形特征,从多个模板唇形特征中确定与所述唇形特征相匹配的目标模板唇形特征;以及
基于所述目标模板唇形特征,从唇形映射关系中的所述多个模板唇动参数中确定所述目标模板唇动参数,其中,所述唇形映射关系表征了所述多个模板唇动参数和所述多个模板唇形特征之间的映射关系。
5.根据权利要求1至4中任一项所述的方法,还包括:
获取对象的唇动视频帧序列;以及
基于所述对象的唇动视频帧序列,确定所述多个模板唇动参数。
6.根据权利要求5所述的方法,还包括:
从所述对象的唇动视频帧序列中确定所述对象的表情视频帧序列;以及
基于所述对象的表情视频帧序列,确定所述多个模板表情参数。
7.一种视频生成装置,包括:
特征确定模块,用于确定与语音特征序列对应的唇形特征序列,其中,所述语音特征序列是从待生成视频的语音数据中提取的;
唇动确定模块,用于基于所述唇形特征序列,从多个模板唇动参数中确定目标模板唇动参数序列,其中,所述多个模板唇动参数是从包括真实唇动的视频中提取得到的;
生成模块,用于基于所述目标模板唇动参数序列,生成目标对象的初始形象序列;以及
时域渲染模块,用于对所述目标对象的初始形象序列进行时域渲染处理,得到所述目标对象的目标形象序列。
8.根据权利要求7所述的装置,还包括:
类型确定模块,用于基于所述待生成视频的语音数据,确定目标表情类型信息;以及
表情确定模块,用于基于所述目标表情类型信息,从表情映射关系中的多个模板表情参数中确定目标模板表情参数序列,其中,所述表情映射关系表征了所述多个模板表情参数和多个表情类型信息之间的映射关系,所述多个模板表情参数是从包括真实表情的视频中提取得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210097018.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双稳态曲线纤维层合板的设计方法
- 下一篇:显示屏及电子设备