[发明专利]语音合成与口型驱动方法、装置、设备及存储介质在审
| 申请号: | 202310162639.9 | 申请日: | 2023-02-24 |
| 公开(公告)号: | CN116246609A | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 刘光毅;唐如意 | 申请(专利权)人: | 成都赛力斯科技有限公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/02;G10L13/027 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 徐光耀 |
| 地址: | 610095 四川省成都市中国(四川)自由贸易*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请提供一种语音合成与口型驱动方法、装置、设备及存储介质,通过获取音素序列特征,然后基于音素序列特征生成音频PPG特征信息,基于音频PPG特征信息以及预先训练得到的预测模型生成音高特征信息和能量特征信息,根据音频PPG特征信息、音高特征信息和能量特征信息生成叠加音频特征信息,根据叠加音频特征信息确定口型特征参数,并根据叠加音频特征信息生成对应的音频,基于口型特征参数确定对应的口型动画,播放口型动画与音频,由于可以直接根据叠加音频特征信息生成对应的音频和对应的口型特征参数,所以无需从音频中进行特征提取,避免了延迟生成口型动画,简化了生成音频和对应口型动画的流程,提升了生成效率。 | ||
| 搜索关键词: | 语音 合成 口型 驱动 方法 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都赛力斯科技有限公司,未经成都赛力斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310162639.9/,转载请声明来源钻瓜专利网。





