[发明专利]语音合成系统评测方法、装置、可读存储介质及终端设备在审

申请号：	202110713810.1	申请日：	2021-06-25
公开（公告）号：	CN113450768A	公开（公告）日：	2021-09-28
发明（设计）人：	苏雪琦;王健宗	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/01	分类号：	G10L15/01
代理公司：	深圳中一联合知识产权代理有限公司 44414	代理人：	刘永康
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成系统评测方法装置可读存储介质终端设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于自然语言处理技术领域，尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。所述方法包括：将预设的文本序列分别输入至待评测的若干个语音合成系统中，并分别获取各个语音合成系统的输出语音序列；获取与所述文本序列对应的基准语音序列；根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离；选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统，并使用所述优选语音合成系统执行语音合成任务。通过本发明，可以在提高评测效率的同时也提高评测准确度。

技术领域

本发明属于自然语言处理技术领域，尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。

背景技术

随着技术的发展，当前出现了很多种的语音合成系统，用于实现从文本到语音(Text To Speech，TTS)的转换过程，不同的语音合成系统之间往往存在较大的性能差异，需要根据实际情况从中选取合适的语音合成系统来执行语音合成任务。但目前往往只能依靠用户的主观感受来对语音合成系统的优劣进行评测，效率低下且准确度较低。

发明内容

有鉴于此，本发明实施例提供了一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备，以解决现有的语音合成系统评测方法效率低下且准确度较低的问题。

本发明实施例的第一方面提供了一种语音合成系统评测方法，可以包括：

将预设的文本序列分别输入至待评测的若干个不同的语音合成系统中，并分别获取各个语音合成系统的输出语音序列；

获取与所述文本序列对应的基准语音序列；

根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离；

选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统，并使用所述优选语音合成系统执行语音合成任务。

在第一方面的一种具体实现中，所述根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离，可以包括：

分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离，所述目标语音序列为任意一个语音合成系统的输出语音序列；

根据所述目标语音序列与所述基准语音序列在各个评测维度上的偏差距离计算所述目标语音序列与所述基准语音序列之间的整体偏差距离。

在第一方面的一种具体实现中，所述评测维度可以包括特征向量、时长和音强；

所述分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离，可以包括：