[发明专利]目标视频的输出方法及装置、存储介质及电子装置在审
申请号: | 202111474972.0 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114187547A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 司马华鹏;王建;汪圆;孙雨泽 | 申请(专利权)人: | 南京硅基智能科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/16;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G10L13/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 阚梦诗 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 视频 输出 方法 装置 存储 介质 电子 | ||
本申请实施例提供了一种目标视频的输出方法及装置、存储介质及电子装置,所述方法包括:获取第一音频和包含目标人物的第一视频;提取第一音频的音频特征和第一视频中目标人物的人脸特征,其中,目标人物的人脸特征为遮盖住嘴部周边区域的局部特征;将第一音频的音频特征与目标人物的人脸特征拼接后输入训练好的神经网络模型;通过神经网络模型输出包含目标虚拟人物的目标视频,其中,目标虚拟人物与目标人物对应,目标虚拟人物的口型与第一音频对应。
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种目标视频的输出方法及装置、存储介质及电子装置。
背景技术
二维(two-dimensional,简称为2D)虚拟人物的生成通常是指通过一个人或几个人的视频数据生成对应的2D虚拟人物,2D虚拟人物在形象上逼近真人,并且针对不同的从文本到语音(Text To Speech,简称为TTS)输入,能够达到与真人接近的口型。可以广泛应用在2D虚拟人物相关的任务上。
目前,相关技术中2D虚拟人物生成方案一般清晰度有限,并且在训练时收敛比较慢,针对不同的人种或者人物特征差别比较大的情况,例如,有无胡子等,模型的训练方式并不通用,需要根据人物特征不断修正训练方式,这也直接影响到最终生成的2D虚拟人物的口型效果。
针对相关技术中,2D虚拟人物生成方案的模型训练效率较低且清晰度较差的问题,相关技术中尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种目标视频的输出方法及装置、存储介质及电子装置,以至少解决相关技术中2D虚拟人物生成方案的模型训练效率较低且清晰度较差的问题。
在本申请的一个实施例中,提出了一种目标视频的输出方法,包括:获取第一音频和包含目标人物的第一视频,其中,所述第一音频为根据文本转换成的语音数据;提取所述第一音频的音频特征和所述第一视频中所述目标人物的人脸特征,其中,所述目标人物的人脸特征为遮盖住嘴部周边区域的局部特征;将所述第一音频的音频特征与所述目标人物的人脸特征拼接后输入训练好的神经网络模型,其中,所述神经网络模型为使用样本数据训练的生成对抗网络模型,所述样本数据包括样本视频数据,所述样本视频数据中包含多个人物对象,所述神经网络模型包括多个门卷积层和多个膨胀门卷积层;通过所述神经网络模型输出包含目标虚拟人物的目标视频,其中,所述目标虚拟人物与所述目标人物对应,所述目标虚拟人物的口型与所述第一音频对应。
在本申请的一个实施例中,还提出了一种目标视频的输出装置,包括:获取模块,配置为获取第一音频和包含目标人物的第一视频,其中,所述第一音频为根据文本转换成的语音数据;提取模块,配置为提取所述第一音频的音频特征和所述第一视频中所述目标人物的人脸特征,其中,所述目标人物的人脸特征为遮盖住嘴部周边区域的局部特征;输入模块,配置为将所述第一音频的音频特征与所述目标人物的人脸特征拼接后输入训练好的神经网络模型,其中,所述神经网络模型为使用样本数据训练的生成对抗网络模型,所述样本数据包括样本视频数据,所述样本视频数据中包含多个人物对象,所述神经网络模型包括多个门卷积层和多个膨胀门卷积层;输出模块,配置为通过所述神经网络模型输出包含目标虚拟人物的目标视频,其中,所述目标虚拟人物与所述目标人物对应,所述目标虚拟人物的口型与所述第一音频对应。
在本申请的一个实施例中,还提出了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在本申请的一个实施例中,还提出了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京硅基智能科技有限公司,未经南京硅基智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111474972.0/2.html,转载请声明来源钻瓜专利网。