[发明专利]一种视频合成方法、装置、设备及存储介质有效

专利信息
申请号: 202110003232.2 申请日: 2021-01-04
公开(公告)号: CN112866586B 公开(公告)日: 2023-03-07
发明(设计)人: 徐楠;郝艳妮;罗引;张西娜;孔庆超;吴晓飞;曲宝玉;曹家;王磊 申请(专利权)人: 北京中科闻歌科技股份有限公司
主分类号: H04N5/265 分类号: H04N5/265;G10L13/04;G10L13/047;G10L21/10;G10L25/57
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 100089 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 视频 合成 方法 装置 设备 存储 介质
【权利要求书】:

1.一种视频合成方法,其特征在于,包括:

获取待合成文本和待合成视频;

对所述待合成文本进行特征转换,生成所述待合成文本的音频流;

基于所述待合成视频中的无音视频流,生成视频内容特征和目标对象的唇部特征,并基于所述待合成文本的音频流,生成音频内容特征和所述音频内容特征对应的口型特征;

将所述口型特征和所述唇部特征进行特征映射,确定口唇映射关系;

基于所述口唇映射关系,融合所述音频特征和所述视频特征,生成融合后的视频序列,并根据所述融合后的视频序列,生成目标合成视频;

其中,所述对所述待合成文本进行特征转换,生成所述待合成文本的音频流,包括:

将所述待合成文本输入至训练完成的语音生成模型,基于所述语音生成模型的编码器对所述待合成文本进行特征提取,得到所述待合成文本的独热向量;

基于所述语音生成模型的解码器,将所述独热向量转换成语音信号;

基于所述语音生成模型的序列生成子模型,将所述语音信号逆变换为时域波信号,将所述时域波信号作为所述待合成文本的音频流。

2.根据权利要求1所述的方法,其特征在于,所述基于所述语音生成模型的解码器,将所述独热向量转换成语音信号,包括:

对所述独热向量进行前处理,得到前处理后的特征向量;

基于所述解码器中的注意力机制,分别抓取所述特征向量和所述独热向量的局部信息,得到所述待合成文本中的关键特征;

对所述关键特征进行线性投影,得到呈线性分布的语音信号。

3.根据权利要求1或2所述的方法,其特征在于,所述基于所述语音生成模型的序列生成子模型,将所述语音信号逆变换为时域波信号,包括:

对所述语音信号进行后处理,基于后处理后的语音信号和后处理前的语音信号,生成对应的梅尔声谱图;

基于所述序列生成子模型,重构所述梅尔声谱图的相位信息,得到所述时域波信号。

4.根据权利要求1所述的方法,其特征在于,所述基于所述待合成视频中的无音视频流,生成视频内容特征和目标对象的唇部特征,包括:

将所述待合成视频中的视频流和音频流分离,得到所述无音视频流;

将所述无音视频流和所述待合成文本的音频流合并,生成初始融合视频;

对所述初始融合视频进行视频编码,生成所述视频内容特征和所述目标对象的唇部特征。

5.根据权利要求4所述的方法,其特征在于,所述对所述初始融合视频进行视频编码,生成所述视频内容特征和所述目标对象的唇部特征,包括:

抽取所述初次融合视频的关键帧,检测每一关键帧中的人脸区域和人脸标记点;

根据所述人脸区域和所述人脸标记点生成视频编码的输入数据;

对所述视频编码的输入数据进行编码,得到所述视频特征和唇部特征。

6.根据权利要求5所述的方法,其特征在于,所述根据所述人脸区域和所述人脸标记点生成视频编码的输入数据,包括:

基于所述抽取的关键帧对所述初次融合视频中的视频进行面部遮挡检测,确定所述关键帧的面部遮挡区域;

根据各关键帧的人脸标记点和所述面部遮挡区域,生成各所述关键帧中包括面部遮挡区域的人脸图像;

基于各所述关键帧中包括面部遮挡区域的人脸图像和所述人脸区域,生成所述视频编码的输入数据。

7.根据权利要求5所述的方法,其特征在于,所述对所述视频编码的输入数据进行编码,得到所述视频内容特征和目标对象的唇部特征,包括:

将所述视频编码的输入数据输入至预先训练好的视频编码模型,基于所述视频编码模型分别对输入数据中的人脸数据和音频数据进行编码;

将编码后的人脸数据和音频数据进行融合,生成所述视频内容特征和所述目标对象的唇部特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科闻歌科技股份有限公司,未经北京中科闻歌科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110003232.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top