[发明专利]跨语言语音转换方法、装置、设备及介质在审

申请号：	202110602042.2	申请日：	2021-05-31
公开（公告）号：	CN113345431A	公开（公告）日：	2021-09-03
发明（设计）人：	倪子凡;王健宗	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/16	分类号：	G10L15/16;G10L15/06;G10L15/00;G10L13/027;G10L25/24
代理公司：	深圳市精英专利事务所 44242	代理人：	涂年影
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语言语音转换方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能领域，提供一种跨语言语音转换方法、装置、设备及介质，能够训练每个目标语言的ASR模型，及训练转换模型，当接收到待处理语音时，利用每个目标语言的ASR模型生成所述待处理语音的PPGs，进一步将所述待处理语音的PPGs输入至所述转换模型，并获取所述转换模型的输出作为所述待处理语音的声学语音参数，启动声码器根据所述待处理语音的声学语音参数合成语音，进而实现跨语言语音转换，并解决使用单个用户录制多语言语料库所带来的困难。此外，本发明还涉及区块链技术，训练得到的模型可存储于区块链节点中。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种跨语言语音转换方法、装置、设备及介质。

背景技术

语音转换(voice conversion，VC)是语音合成研究领域中的热门研究方向，旨在保留同一机器人语音特征的同时实现跨多语言的扩展功能。

目前，业内对于语音转换的研究应用很多，包括各大公司的语音助手以及智能人机交互等语音技术产品。

但是，基于现有的语音转换技术，当同一机器人为不同语言或方言而改变声音特征时，会变得十分不自然。所以，各大人工智能企业都在研究和实现中英文跨语言以及各大方言的语音转换功能，并希望在保留语音特征的同时扩展多语言支持，从而提高用户对于机器人跨语言功能的满意度，同时提升用户的体验感。

现有的多语言TTS(Text To Speech，从文本到语音)系统，通常需要使用单个说话人录制的多语言语料库，显然，在这种方式下，录制难度会因语言种类的增加而增加。因此，使用传统方法来生成一个支持多语言、多方言的TTS系统是很难实现的。

发明内容

鉴于以上内容，有必要提供一种跨语言语音转换方法、装置、设备及介质，能够实现跨语言语音转换，并解决使用单个用户录制多语言语料库所带来的困难。

一种跨语言语音转换方法，所述跨语言语音转换方法包括：

获取预先配置的多个目标语言，并调用与所述多个目标语言相对应的多个通用语料库；

提取每个通用语料库中语料的梅尔频率倒谱系数MFCC作为训练数据，并分别训练对应于每个目标语言的自动语音识别ASR模型；