[发明专利]一种融合情感编码的音频驱动人脸动画生成方法及系统有效
| 申请号: | 202110934743.6 | 申请日: | 2021-08-16 |
| 公开(公告)号: | CN113378806B | 公开(公告)日: | 2021-12-14 |
| 发明(设计)人: | 李太豪;刘逸颖;郑书凯;刘昱龙;马诗洁;阮玉平 | 申请(专利权)人: | 之江实验室 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T13/40;G06N3/04;G06N3/08;G10L15/02;G10L15/06;G10L15/16;G10L25/30;G10L25/63 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
| 地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明属于人工智能领域,涉及一种融合情感编码的音频驱动人脸动画生成方法及系统,该方法为:首先对采集的音频信号进行预处理,提取MFCC特征后输入语音识别模块,进一步提取音频特征,同时将MFCC特征输入语音情感识别模块,得到情感类别并进行one‑hot编码,然后将音频特征和情感的one‑hot编码向量进行连接,输入表情识别模块得到基于3DMM模型的表情系数,最后将表情系数与人脸模板输入人脸动画生成模块,得到带表情的3D人脸动画。本发明方法计算量小,训练稳定,流程简单,成本低廉,能够极大的降低电影制作周期和成本,且充分考虑了语音传达的情感状态,对在网络中输入了情感编码,使得生成的人脸动画更加生动形象,能够给用户带来更优质的体验。 | ||
| 搜索关键词: | 一种 融合 情感 编码 音频 驱动 动画 生成 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110934743.6/,转载请声明来源钻瓜专利网。
- 上一篇:基于延时状态的目标数据处理系统
- 下一篇:一种体积流量计现场标定装置





