[发明专利]用于提供改进的语音合成的方法、设备和计算机程序产品无效

专利信息
申请号: 200980120201.2 申请日: 2009-05-19
公开(公告)号: CN102047321A 公开(公告)日: 2011-05-04
发明(设计)人: J·纽尔米南;T·赖蒂奥;A·叙尼;M·瓦伊尼奥;P·阿尔库 申请(专利权)人: 诺基亚公司
主分类号: G10L13/04 分类号: G10L13/04;G10L19/08;G10L19/14
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 芬兰*** 国省代码: 芬兰;FI
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 提供 改进 语音 合成 方法 设备 计算机 程序 产品
【说明书】:

相关申请的交叉引用

本申请要求于2008年5月30日提交的美国临时申请No.61/057,542的优先权,通过引用将其全文并入于此。

技术领域

发明的实施方式总体地涉及语音合成,并更具体地涉及用于使用声门脉冲集合来提供改进的语音合成的方法、设备和计算机程序产品。

背景技术

现代通信时代带来了有线和无线网络的极大普及。计算机网络、电视网络和电话网络正在经历由消费者需求激发的前所未有的技术扩展。无线和移动网络互联技术已经解决了相关的消费者需求,同时提供了更为灵活和及时的信息传送。

目前和未来的网络互联技术持续地促进信息传输的简易性和对用户而言的便捷性。对增加信息传输易用性存在需求的一个领域涉及向移动终端的用户递送服务。服务可以是用户期望的特定媒体或通信应用的形式,诸如音乐播放器、游戏机、电子书、短消息、电子邮件等。服务还可以是交互应用的形式,其中用户可以响应于网络设备从而执行任务或实现目标。可以从网络服务器或其他网络设备,或者甚至从移动终端(例如,移动电话、移动电视、移动游戏系统等)提供服务。

在很多应用中,对于用户而言需要从网络或移动终端接收诸如口头反馈或指令的音频信息。此类应用的一个示例可以是支付账单、命令程序、接收驱动指令等。此外,在诸如音频书的某些服务中,举例而言,应用几乎完全基于接收音频信息。由计算机生成话音提供此类音频信息正变得越来越普遍。因而,使用此类应用的用户体验将大大地依赖于计算机生成话音的质量和自然性。因此,在改进计算机生成话音的质量和自然性的努力中,很多研究和开发已经深入于语音处理技术之中。

语音处理通常可以包括以下应用,诸如文本到语音(TTS)转换、语音编码、话音转换、语言识别和很多其他类似应用。在很多语音处理应用中,可以提供计算机生成话音或合成语音。在一个具体示例中,作为根据计算机可读文本的可听语音的创建的TTS可以用于语音处理,该语音处理包括选择以及连结声学单元。然而,TTS的此类形式通常需要巨量的已存储语音数据并且不适于不同的讲话者和/或讲话风格。在备选示例中,可以采用隐马尔科夫模型(HMM)方法,在该方法中,可以在语音生成中使用较少量的存储数据。然而,当前HMM系统经常遭受质量中降级的自然性。换言之,很多人可能认为当前的HMM系统倾向于过于简化的信号生成技术而因此不能适当地模仿自然语音声压波形。

特别是在移动环境中,对存储器消耗的增加可以直接影响采用此类方法的设备成本。因此,由于存在利用相对较少资源需求进行语音合成的可能,HMM系统在某些情况中可能是优选的。然而,即使在非移动环境中,对应用空间和存储器消耗的可能增加可能不是所期望的。因而,期望开发一种例如可以支持以有效方式提供更自然声音的合成语音的改进语音合成机制。

发明内容

在一个示例性实施方式中,提供了一种提供语音合成的方法。该方法可以包括至少部分地基于与真实声门脉冲相关联的性质,从一个或多个存储的真实声门脉冲中选择真实声门脉冲;将选择的真实声门脉冲用作生成激励信号的基础;以及基于由模型生成的谱参数修改所述激励信号来提供合成语音。

在另一示例性实施方式中,提供一种用于提供语音合成的计算机程序产品。该计算机程序产品可以包括具有存储于其中的计算机可执行程序代码指令的至少一个计算机可读存储介质。所述计算机可执行程序代码指令可以包括用于至少部分地基于与真实声门脉冲相关联的性质从一个或多个存储的真实声门脉冲中选择真实声门脉冲的程序代码指令;用于将选择的真实声门脉冲用作生成激励信号的基础的程序代码指令;以及用于基于由模型生成的谱参数修改所述激励信号来提供合成语音的程序代码指令。

在另一示例性实施方式中,提供一种用于提供语音合成的设备。该设备可以包括处理器和存储可执行指令的存储器。响应于所述处理器对指令的执行,该设备至少可以执行:至少部分地基于与真实声门脉冲相关联的性质,从一个或多个存储的真实声门脉冲中选择真实声门脉冲;将选择的真实声门脉冲用作生成激励信号的基础;以及基于由模型生成的谱参数修改所述激励信号来提供合成语音。

附图说明

由此,已经从总体上描述了本发明的实施方式,现在将对附图加以参考,附图未必是按比例绘制的,在附图中:

图1是根据本发明示例性实施方式的移动终端的示意性框图;

图2是根据本发明示例性实施方式的无线通信系统的示意性框图;

图3示出了根据本发明示例性实施方式的、用于提供改进语音合成的设备的部分的框图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200980120201.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top