[发明专利]一种基于PPG一致性的最优映射跨语言音色转换方法及系统在审
申请号: | 202110567496.0 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113327583A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 吴志勇;户建坤;陈学源 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L21/003 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ppg 一致性 最优 映射 语言 音色 转换 方法 系统 | ||
1.一种基于PPG一致性的最优映射跨语言音色转换方法,特征在于,所述方法包括:
S1,获取用户输入的原始语音波形;
S2,基于预设的PPG确定策略,确定所述原始语音波形对应的第一PPG序列和预置目标说话人的语料库对应的目标PPG集合;
S3,从所述第一PPG序列中的第一语音帧开始,从所述目标PPG集合中搜索距离所述第一PPG序列中当前语音帧对应的PPG距离最近的目标PPG集合中的一帧PPG,直至遍历完所述第一PPG序列,并将为所述第一PPG序列中的每一语音帧搜索到的所述第二语音后验概率PPG组成最优映射PPG序列;
S4,将所述最优映射PPG序列输入到预先训练好的神经网络声学模型中,得到目标说话人的梅尔谱,并根据预设的声码转换策略,将所述目标说话人的梅尔谱转换为目标说话人的语音波形,从而实现将所述用户输入的原始语音波形转换为目标说话人的语音波形。
2.根据权利要求1所述的方法,其特征在于,所述第一PPG序列由所述原始语音波形包含的每一语音帧对应的第一语音后验概率PPG组成;所述目标PPG集合由所述预置目标说话人的语料库中每一句语音对应的所有帧PPG序列组成的集合。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中基于预设的PPG确定策略,确定所述原始语音波形对应的第一PPG序列的步骤,包括:
S2.1,根据预设的语音信号处理技术,从所述原始语音波形中提取出所述原始语音波形中包含的每一语音帧对应的声学特征;
S2.2,利用预先训练好的自动语音识别ASR模型,得到所述原始语音波形中包含的每一语音帧对应的第一语音后验概率PPG;
S2.3,将所述每一语音帧对应的第一语音后验概率PPG,组成所述原始语音波形对应的第一PPG序列。
4.根据权利要求1所述的方法,其特征在于,所述原始语音波形不同于所述目标说话人的语音波形。
5.根据权利要求1所述的方法,其特征在于,所述原始语音波形对应的语言类型与所述预置目标说话人的语料库中每一句语音对应的语言相同和/或不同。
6.根据权利要求1所述的方法,其特征在于,还包括:
确定所述原始语音波形对应的第一PPG序列与最终声码器得到的所述目标说话人的语音波形对应的第三PPG序列之间的距离,并根据两个所述PPG序列的距离判断所述目标说话人的语音内容是否达到一致性标准要求。
7.一种基于PPG一致性的最优映射跨语言音色转换系统,其特征在于,包括:
获取模块,用于获取用户输入的原始语音波形;
PPG提取模块,用于基于预设的PPG确定策略,确定所述原始语音波形对应的第一PPG序列;其中,所述第一PPG序列由所述原始语音波形包含的每一语音帧对应的第一语音后验概率PPG组成;以及,将根据所述预设的PPG确定策略,得到的预置目标说话人的语料库中每一句语音对应的所有帧PPG,组成预置目标说话人的语料库对应的目标PPG集合;
最优映射模块,用于从所述第一PPG序列中的第一语音帧开始,从所述目标PPG集合中搜索距离所述第一PPG序列中当前语音帧对应的PPG距离最近的目标PPG集合中的一帧PPG,直至遍历完所述第一PPG序列,并将为所述第一PPG序列中的每一语音帧搜索到的所述第二语音后验概率PPG组成最优映射PPG序列;
神经网络声学模型模块,用于将所述最优映射PPG序列输入到预先训练好的神经网络声学模型中,得到目标说话人的梅尔谱;
声码器模块,用于并根据预设的声码转换策略,将所述目标说话人的梅尔谱转换为目标说话人的语音波形,从而实现将所述用户输入的原始语音波形转换为目标说话人的语音波形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110567496.0/1.html,转载请声明来源钻瓜专利网。