[发明专利]一种模型训练和语音交互的方法及装置在审

申请号：	202110509888.1	申请日：	2021-05-11
公开（公告）号：	CN113314092A	公开（公告）日：	2021-08-27
发明（设计）人：	张永超;王俊;虞国桥	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/033;G10L13/08;G10L15/02;G10L15/26;G10L25/87
代理公司：	北京曼威知识产权代理有限公司 11709	代理人：	方志炜
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种模型训练语音交互方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书公开了一种模型训练和语音交互的方法及装置，业务平台可以获取语音数据，并根据该语音数据，确定该语音数据对应的待补偿语音信息，其中，该待补偿语音信息用于表征语音数据中包含的各语音单元对应的原始语音特征。而后，确定该语音数据对应的发音习惯特征，并根据该发音习惯特征，对该待补偿语音信息进行补偿，得到补偿后语音信息，以及将该补偿后语音信息输入到待训练的语音合成模型，得到语音合成结果，最后，以最小化该语音合成结果与该语音数据之间的偏差为优化目标，对该语音合成模型进行训练，从而，通过该语音合成模型进行语音合成，能够降低自动合成的语音与人们平时说出的语音之间的偏差。

技术领域

本说明书涉及机器学习领域，尤其涉及一种模型训练和语音交互的方法及装置。

背景技术

随着信息技术的不断发展，智能语音客服、语音导航等依赖于自动合成语音的业务已经逐渐融入到人们的生活中，为人们的生活带来了便利。

在这些业务中，如何自动进行语音的合成是更好实现这些业务的重点，而在现有技术中，自动合成的语音通常与人们平时的说话偏差较大，例如，有些自动合成的语音较为机械化，说出的每个字的时间间隔通常较为一致，若是将这种语音应用到上述智能语音客服、语音导航等业务时，用户可能会难以适应这样的语音。

所以，如何降低自动合成的语音与人们平时说出的语音之间的偏差，则是一个亟待解决的问题。

发明内容

本说明书提供一种模型训练和语音交互的方法及装置，以部分地解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种模型训练的方法，包括：

获取语音数据；

根据所述语音数据，确定所述语音数据对应的待补偿语音信息，所述待补偿语音信息用于表征所述语音数据中包含的各语音单元对应的原始语音特征；