[发明专利]一种基于解耦表示学习的说话人脸视频生成方法有效
申请号: | 202010420200.8 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111666831B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 熊盛武;林承德;路雄博;陈燚雷;刘锋;陈如意;曹丹凤 | 申请(专利权)人: | 武汉理工大学;武汉水象电子科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06V10/764;G10L25/63 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于解耦表示学习的说话人脸视频生成方法,采用分类对抗的方法将音频中的人物身份特征、语音特征及情绪特征解耦,并且用分类对抗的方法将视频中的人物身份特征、语音特征及情绪特征解耦,这些特征的解耦提高了本方法对生成说话视频的可操控性。采用对偶学习对音频中的语音特征和静音视频中的语音特征进行映射,对音频中的情绪特征和静音视频中的情绪特征进行映射,实现了音频和视频的跨模态特征转换,极大提高了从音频生成说话人脸视频的便利性,也提高了生成说话人脸视频的连贯与自然程度。本发明可以根据任意单张人脸图片及音频生成真实自然的说话视频,无需大量特定人脸视频,提高了易用性。 | ||
搜索关键词: | 一种 基于 表示 学习 说话 视频 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学;武汉水象电子科技有限公司,未经武汉理工大学;武汉水象电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010420200.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种农业用甘蔗搅碎榨汁装置
- 下一篇:一种船用电泵的系统总成及其工作方法