[发明专利]高保真的智能客服语音合成方法有效

申请号：	201811584612.4	申请日：	2018-12-24
公开（公告）号：	CN109686358B	公开（公告）日：	2021-11-09
发明（设计）人：	刘嗣平;柯登峰;陈孟达;贾宇康	申请（专利权）人：	广州九四智能科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G10L13/10
代理公司：	深圳科湾知识产权代理事务所(普通合伙) 44585	代理人：	李晓林
地址：	510000 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	高保真智能客服语音合成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种高保真的智能客服语音合成方法，包括：进行语音的录制；建立初始语料库；对录制好的语音进行强制对齐；进行语音切割得到三音子模型；利用三音子模型形成目标语料库；对于切割好的三音子基元计算似然；建立三音子决策树；根据所需合成文本选择合适的三音子基元；对选择的三音子基元，针对原始语音波形做基音同步标注；对原始语音波形的基音曲线与目标基音曲线建立映射，得到短时合成信号序列；将短时信号序列与目标基音周期同步排列，重叠相加得到拼接合成的语音；将合成的语音插入到提前录制好的语音中。本发明不必让客服人员录制大量重复类似的含有变量的语音，能够降低语音录制成本，还能提升整个对话过程的流畅性与自然度。

技术领域

本发明涉及语音合成领域，特别涉及一种高保真的智能客服语音合成方法。

背景技术

目前的语音识别与语音合成技术发展迅速，但是相关语音合成技术合成后的语音的自然度不是很理想，在应用于客服语音中时，客户会明显听出是机器的声音，大部分的客服语音其实是可以预先录制好语音，但是对于金钱、时间等变量，无法大量录制，会耗费大量的财力，也不现实，并且会与提前录制好的语音之间产生明显的区别，整个对话过程会显得非常奇怪。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种不必让客服人员录制大量重复类似的含有变量的语音，能够降低语音录制成本，还能提升整个对话过程的流畅性与自然度的高保真的智能客服语音合成方法。

本发明解决其技术问题所采用的技术方案是：构造一种高保真的智能客服语音合成方法，包括如下步骤：

A)录音人员根据设置好的文本进行语音的录制；

B)建立初始语料库；所述初始语料库中至少包含常用字、常用词语、有关钱类的量词以及一到十的语句；

C)利用设定算法对所述初始语料库中录制好的语音进行强制对齐；

D)对强制对齐后的语音进行切割，得到三音子模型；

E)利用所述三音子模型形成处理完好的目标语料库；

F)对于所述目标语料库中切割好的三音子基元计算似然；

G)建立三音子决策树；

H)根据所需合成文本，选择合适的三音子基元；

I)对选择好的三音子基元，针对原始语音波形做基音同步标注；