首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种三维虚拟形象唇形生成方法、装置及电子设备有效

申请号：	202110610872.X	申请日：	2021-06-02
公开（公告）号：	CN113256821B	公开（公告）日：	2022-02-01
发明（设计）人：	张家珺;冀志龙;高原;刘霄	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G06T19/00	分类号：	G06T19/00;G10L25/63;G06N3/08;G06K9/62;G06V10/774
代理公司：	北京北汇律师事务所 11711	代理人：	马亚坤
地址：	100086 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种三维虚拟形象生成方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开公开了一种三维虚拟形象唇形生成方法、装置及电子设备，该方法包括获取语音数据，根据语音数据得到表情参数和姿态参数，表情参数表示唇部的表情信息，姿态参数表示口型信息，根据表情参数和姿态参数生成三维虚拟形象唇形。通过本公开解决了现有技术中如何提升三维虚拟唇形生成的同步度、自然度的问题。

技术领域

本公开涉及动画制作技术领域，具体涉及一种三维虚拟形象唇形生成方法、装置及电子设备。

背景技术

视觉，听觉和文字是人与人或人与机器交互中的重要通道，这几种模式的信息有很强的相关性。近年来，跨模态学习和模态建模在计算机视觉，计算机图形学等研究领域受到广泛关注，然而利用文本生成面部三维属性的研究仍然较少。

三维虚拟形象的表情，唇形生成目前需要动画工程师使用专业动画制作软件如Unity3d，Maya等，并利用动画技术如blendshape，蒙皮骨骼动画等，根据需求逐帧手调参数。这种制作方法成本极高，并且不具备泛化性，每次提出新制作内容时，都需要动画师逐帧重新制作调整。

发明内容

有鉴于此，本公开实施例提供了一种三维虚拟形象唇形生成方法、装置及电子设备，以解决现有技术中如何提升三维虚拟唇形生成的同步度、自然度的问题。

为此，本公开实施例提供了如下技术方案：

本公开第一方面，提供了一种三维虚拟形象唇形生成方法，包括：

获取语音数据；

根据所述语音数据得到表情参数和姿态参数；其中，所述表情参数表示唇部的表情信息，所述姿态参数表示口型信息；

根据所述表情参数和所述姿态参数生成三维虚拟形象唇形。

可选地，根据所述语音数据得到表情参数和姿态参数包括：

所述语音数据经预训练的深度神经网络模型得到所述表情参数和所述姿态参数；其中，所述预训练的深度神经网络模型的训练包括：

获取音频数据样本以及与所述音频数据样本对应的视频数据样本；

根据所述视频数据样本得到3DMM参数；其中，所述3DMM参数为与所述视频数据样本对应的形状参数、表情参数和姿态参数，或者，所述3DMM参数为与所述视频数据样本对应的表情参数和姿态参数；

根据音频数据样本输入深度神经网络模型的输出，以及所述3DMM参数对深度神经网络模型进行训练，得到所述预训练的深度神经网络模型。

可选地，获取音频数据样本以及与所述音频数据样本对应的视频数据样本包括：获取人脸区域的音视频数据样本；对所述人脸区域的音视频数据样本进行音视频分离，得到所述音频数据样本和所述视频数据样本。

可选地，所述预训练的深度神经网络模型包括音频编码器和音频解码器；

其中，所述音频编码器包括卷积神经网络和循环神经网络；

所述音频解码器包括残差模块、注意力模块和全连接层。

可选地，根据音频数据样本输入深度神经网络模型的输出，以及所述3DMM参数对深度神经网络模型进行训练包括：

将音频数据样本输入至所述深度神经网络模型得到训练的3DMM参数的顶点信息；其中，所述训练的3DMM参数至少包括与所述音频数据样本对应的表情参数和姿态参数；

通过与所述音频数据样本对应的视频数据样本，得到真实的3DMM参数的顶点信息；其中，所述真实的3DMM参数至少包括与所述视频数据样本对应的表情参数和姿态参数；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司，未经北京世纪好未来教育科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110610872.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种烟雾发生器及烟雾系统
下一篇：一种联动型转盘式气体传导机构

同类专利

专利分类

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T19-00 对用于电脑制图的3D[三维]模型或图像的操作
G06T19-20 .3D图像的编辑，例如：改变形状或颜色，排列物体或定位部件

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top