[发明专利]一种基于时序卷积的语音驱动口型的方法和系统在审

申请号：	202210116972.1	申请日：	2022-02-08
公开（公告）号：	CN114495908A	公开（公告）日：	2022-05-13
发明（设计）人：	王松坡	申请（专利权）人：	北京中科深智科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/16;G10L25/18;G10L25/30;G10L25/45
代理公司：	暂无信息	代理人：	暂无信息
地址：	100000 北京市大兴区北京经***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于时序卷积的语音驱动口型的方法和系统，包括：采用blendshape来表示嘴部的动作，通过神经网络输出多个blendshape的权重，通过组合这些blendshape的值，得到嘴部动作的合理表示；嘴部动作的合理表示需要进行离散化，离散化的声音信号为时域信号，将时域信号经过傅里叶变换转换到频域中，完成特征转换。本发明引入了时序卷积，将时序卷积网络用于处理语音频谱特征，较好的解决了时序信息依赖和生成模式单一的问题。
搜索关键词：	一种基于时序卷积语音驱动口型方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京中科深智科技有限公司，未经北京中科深智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210116972.1/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载