[发明专利]基于共享训练的多尺度StarGAN的语音转换方法有效
申请号: | 202010168942.6 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111462768B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 李燕萍;沙淮;徐伶俐 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L21/013 | 分类号: | G10L21/013;G10L19/00;G10L13/04;G10L25/18;G10L25/48;G06N3/094;G06N3/0464;G06N3/047 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 刘文闻 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于共享训练的多尺度StarGAN的语音转换方法,使用多尺度StarGAN结构,在不同级别上来表示多尺度特征并且增加了每层网络的感受野范围,同时使用残差连接,缓解梯度消失的问题,使得网络能够更深层次地传播,显著地提升了转换后的语音质量,进一步使用Share‑Learning训练鉴别器和分类器的共享模块Share‑Block,不仅能够减少模型参数,而且共享模块的参数可以同时训练到,能够加快鉴别器和分类器训练过程,提升鉴别器和分类器的性能,实现了一种高质量的语音转换方法,在跨语种语音转换、电影配音、语音翻译和医疗辅助等领域有很好的应用前景。 | ||
搜索关键词: | 基于 共享 训练 尺度 stargan 语音 转换 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010168942.6/,转载请声明来源钻瓜专利网。