[发明专利]语音合成系统评测方法、装置、可读存储介质及终端设备在审
申请号: | 202110713810.1 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113450768A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 苏雪琦;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 系统 评测 方法 装置 可读 存储 介质 终端设备 | ||
本发明属于自然语言处理技术领域,尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。所述方法包括:将预设的文本序列分别输入至待评测的若干个语音合成系统中,并分别获取各个语音合成系统的输出语音序列;获取与所述文本序列对应的基准语音序列;根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离;选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统,并使用所述优选语音合成系统执行语音合成任务。通过本发明,可以在提高评测效率的同时也提高评测准确度。
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。
背景技术
随着技术的发展,当前出现了很多种的语音合成系统,用于实现从文本到语音(Text To Speech,TTS)的转换过程,不同的语音合成系统之间往往存在较大的性能差异,需要根据实际情况从中选取合适的语音合成系统来执行语音合成任务。但目前往往只能依靠用户的主观感受来对语音合成系统的优劣进行评测,效率低下且准确度较低。
发明内容
有鉴于此,本发明实施例提供了一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备,以解决现有的语音合成系统评测方法效率低下且准确度较低的问题。
本发明实施例的第一方面提供了一种语音合成系统评测方法,可以包括:
将预设的文本序列分别输入至待评测的若干个不同的语音合成系统中,并分别获取各个语音合成系统的输出语音序列;
获取与所述文本序列对应的基准语音序列;
根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离;
选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统,并使用所述优选语音合成系统执行语音合成任务。
在第一方面的一种具体实现中,所述根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离,可以包括:
分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离,所述目标语音序列为任意一个语音合成系统的输出语音序列;
根据所述目标语音序列与所述基准语音序列在各个评测维度上的偏差距离计算所述目标语音序列与所述基准语音序列之间的整体偏差距离。
在第一方面的一种具体实现中,所述评测维度可以包括特征向量、时长和音强;
所述分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离,可以包括:
计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离;
计算所述目标语音序列与所述基准语音序列在时长这一评测维度上的偏差距离;
计算所述目标语音序列与所述基准语音序列在音强这一评测维度上的偏差距离。
在第一方面的一种具体实现中,所述计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离,可以包括:
根据下式计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110713810.1/2.html,转载请声明来源钻瓜专利网。