[发明专利]一种基于卷积神经网络的说话人脸视频生成方法及装置有效
申请号: | 202110637611.7 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113378697B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 李腾;刘晨然;王妍 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V40/20;G06V10/74;G06V10/774;G06V10/82;G06N3/04;G06N3/08;G10L21/10 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 丁瑞瑞 |
地址: | 230039 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络的说话人脸视频生成方法及装置,所述方法包括:构建数据集;设计唇音同步判别器;利用数据集训练唇音同步判别器,得到训练好的唇音同步判别器;构建说话人脸生成网络;利用数据集训练说话人脸生成网络,得到训练好的说话人脸生成网络;将目标语音和目标人物的人脸图片输入训练好的说话人脸生成网络生成目标人物说目标语音的视频;本发明的优点在于:能够生成清晰度较高且唇部运动与语音同步的真实性较高的说话人脸视频。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 说话 视频 生成 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110637611.7/,转载请声明来源钻瓜专利网。
- 上一篇:TFT显示开发系统
- 下一篇:基于自容式电液执行器的一体化速关调节阀