[发明专利]虚拟形象的视频生成方法、装置、计算机设备和存储介质在审
申请号: | 202211245566.1 | 申请日: | 2022-10-12 |
公开(公告)号: | CN115690276A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 赵安琪;方骅;奚晓斌;陈馥婧 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06T13/40 | 分类号: | G06T13/40;G06T13/20 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 胡雪 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚拟 形象 视频 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种虚拟形象的视频生成方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取针对目标虚拟形象的形象描述标签集,将形象描述标签集输入至预训练的形象图像生成模型,得到与形象描述标签集对应的目标虚拟形象图像;获取与目标虚拟形象所属的形象类型对应的向量动作变化参数集;将待播报语音中的各待播报音素与向量动作变化参数集中各样本音素对应的向量变化数据相匹配,得到目标虚拟形象与待播报语音相匹配的目标向量动作变化参数集;根据待播报语音、目标向量动作变化参数集和目标虚拟形象图像,生成目标虚拟形象播报待播报语音的目标视频。采用本方法能够提高目标虚拟形象的视频生成效率。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种虚拟形象的视频生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的不断发展,大多企业或机构为提升服务质量以及客户体验,一般采用虚拟形象进行服务。
为了利用虚拟形象进行服务,需要获取虚拟形象的自然发言视频,而这需要通过已采集的真人影像进行模型训练得到。相关技术中,每制作一个新的虚拟形象的视频时,都需要针对新的虚拟形象重新进行真人影像采集,以重新进行动作模型训练和模型参数调整,再根据训练好的动作模型制作该新的虚拟模型针对待播报语音的发言视频,导致需要耗费大量的人力资源和时间成本,难以高效生成虚拟形象的视频。
因此,相关技术中,存在着虚拟形象的视频生成效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高虚拟形象的视频生成效率的虚拟形象的视频生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种虚拟形象的视频生成方法。所述方法包括:
获取针对目标虚拟形象的形象描述标签集,将所述形象描述标签集输入至预训练的形象图像生成模型,得到与所述形象描述标签集对应的目标虚拟形象图像;
获取与所述目标虚拟形象所属的形象类型对应的向量动作变化参数集;所述向量动作变化参数集包括播报样本语音中的各样本音素对应的向量变化数据;所述各样本音素对应的向量变化数据为所述形象类型对应的预设形象执行各所述样本音素对应的发音动作时,所述预设形象的活动部位向量的向量变化数据;
将待播报语音中的各待播报音素与所述向量动作变化参数集中各所述样本音素对应的向量变化数据相匹配,得到所述目标虚拟形象与所述待播报语音相匹配的目标向量动作变化参数集;
根据所述待播报语音、所述目标向量动作变化参数集和所述目标虚拟形象图像,生成所述目标虚拟形象播报所述待播报语音的目标视频。
在其中一个实施例中,所述方法还包括:
获取所述目标虚拟形象对应的形象描述参数;所述形象描述参数为对所述形象描述标签集中与各形象描述类别对应的形象描述标签进行量化得到的;
在各预设形象类型所对应的预设形象描述参数中,确定所述形象描述参数对应的目标形象描述参数;
将所述目标形象描述参数对应的预设形象类型,作为所述目标虚拟形象所属的形象类型。
在其中一个实施例中,所述在各预设形象类型所对应的预设形象描述参数中,确定所述形象描述参数对应的目标形象描述参数,包括:
将所述形象描述参数中与各所述形象描述类别对应的形象描述子参数,作为各形象描述维度上的维度数据,得到所述目标虚拟形象对应的形象描述坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211245566.1/2.html,转载请声明来源钻瓜专利网。