[发明专利]用于文本转语音性能评价的系统和方法有效

专利信息
申请号: 201380080087.1 申请日: 2013-10-24
公开(公告)号: CN105593936B 公开(公告)日: 2020-10-23
发明(设计)人: C·伊泽特;赖胜;C·聚斯;H·胡 申请(专利权)人: 宝马股份公司
主分类号: G10L25/69 分类号: G10L25/69
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 李颖
地址: 德国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文本 语音 性能 评价 系统 方法
【说明书】:

发明提供用于文本转语音性能评价的系统和方法。在例证实施例中,一种用于文本转语音(TTS)性能评价的方法包括:提供多个语音样本和与相应语音样本关联的得分;根据所述多个语音样本和对应得分,建立语音模型;和通过语音模型评价TTS引擎。本发明只需要一人在开始阶段生成标准语音模型,该语音模型可反复用于不同TTS合成引擎的测试和评价。本发明中提出的解决方案大大降低了所需的时间和人工成本。

技术领域

本发明涉及文本转语音(TTS)合成的领域,更具体地,涉及用于文本转语音合成的性能评价的系统和相关方法。

背景技术

话音控制技术已被研究20年以上,许多提出的益处已在各种应用中得到证明。计算机硬件和软件的不断发展使话音控制技术的使用更实用、灵活和可靠。结果,话音控制系统在现代电子设备中变得越来越普及。例如,话音控制系统已被结合到智能电话机、车载电子设备(比如可从BMW Corp.获得的iSpeech系统)、智能家居应用等中。

话音控制系统一般基于语音识别和文本转语音(TTS)合成。语音识别可把用户产生的音频信号转换成对应命令,根据所述命令,电子设备进行特定操作。另一方面,文本转语音合成向用户提供话音读出功能。例如,在车载电子设备的情况下,语音识别可让驾驶员利用口头命令控制诸如电话机、空调、导航和音响系统之类的功能部件,并且文本转语音合成可提供话音导航信息,或者为驾驶员朗读电子邮件或SMS消息。这不仅更舒适,而且安全:驾驶员的双手始终保持在方向盘上,他(她)对周围交通情况的注意力不被分散。

文本转语音合成是文本到语音的转换。这种转换依照特定语言的发音规范,把文本变换成尽可能接近真实人类语音的合成语音。通常,TTS合成包含自然语言处理的第一步骤。更具体地,文本输入被变换成包括待产生的音素、其持续时间、短语边界的位置以及各个短语的音高/频率轮廓的语言表达。随后,TTS合成的第二步骤是通过数字信号处理,把在语言分析阶段中获得的标音和韵律信息变换成声波波形。K.R.Aida-Zade等在“the mainprinciples of text-to-speech synthesis system”(International Journal ofSignal Processing,Vol.6,No.1,2010)中也描述了TTS合成系统,该文献通过引用整体包含于此。

TTS的质量非常重要,因为它与TTS合成系统或引擎生成的话音输出是否可被客户理解以及当听到所述话音输出时客户是否感到舒适有关。语音合成系统的最关键质量是自然性和可懂度。自然性描述输出的声音到底有多像人类语音,而可懂度是理解所述输出的容易度。理想的语音合成器既自然又易懂。语音合成系统通常试图使这两种特性最大化。

目前,存在许多可用的TTS引擎,比如Apple Corp.的Siri、Microsoft Corp.的SAM、Android TTS引擎以及许多其它因特网TTS引擎。从而,出现如何评价这样的引擎以便选择对客户来说最佳的TTS产品的挑战。TTS评价旨在关于诸如可懂度和自然性之类的重要准则,评价由TTS合成引擎生成的语音。在TTS性能的评价中,一般使用主观评价方法,比如MOS(平均意见得分)、DRT(诊断押韵测试)、DAM(诊断接受度测量)、CT(理解测试)等。

以MOS为例,它是通过计算一组标准和主观测试的结果的平均值进行的,在所述一组测试中,许多听众评定由TTS合成引擎生成的测试句子的感知话音质量的等级。下表1表示MOS分级方案。MOS被表示成在1-5的范围中的单一数字,其中1是最低的感知音频质量,5是最高的感知音频质量测量。通过求所有听众的所有得分的平均值,计算各个测试句子的感知得分。

表1:MOS分级方案

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝马股份公司,未经宝马股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380080087.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top