[发明专利]基于智能机器人的多TTS引擎输出语速调节方法及系统有效
申请号: | 201610898765.0 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106486111B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 王合心 | 申请(专利权)人: | 北京光年无限科技有限公司 |
主分类号: | G10L13/033 | 分类号: | G10L13/033 |
代理公司: | 11611 北京聿华联合知识产权代理有限公司 | 代理人: | 朱绘;张文娟 |
地址: | 100000 北京市石景山区石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于智能机器人的多TTS引擎输出语速调节方法及系统,其中,该方法包括:朗读速度确定步骤,接收多模态交互数据,对多模态交互数据进行解析,确定出需调用的TTS引擎的类型和朗读速度;输出语速确定步骤,基于语速调整模型及需调用的TTS引擎的类型和朗读速度计算需调用的TTS引擎的输出语速;语音输出步骤,调用需调用的TTS引擎以输出语速进行语音输出。相较于现有的多TTS引擎输出语速调节方法,本方法不再需要用户来对各个TTS引擎分别进行相关参数的设置,而是能够使用同一套语速调节方案来实现对不同的TTS引擎的速度设置,从而提高了多TTS引擎输出语速调节的高效性和便捷性。 | ||
搜索关键词: | 基于 智能 机器人 tts 引擎 输出 语速 调节 方法 系统 | ||
【主权项】:
1.一种基于智能机器人的多TTS引擎输出语速调节方法,其特征在于,包括:/n朗读速度确定步骤,接收多模态交互数据,对所述多模态交互数据进行解析,从配置的多个TTS引擎中确定出需调用的TTS引擎的类型和朗读速度,其中,所配置的多个TTS引擎对应的输出语速范围不完全相同,所述朗读速度具有一统一的取值范围;/n输出语速确定步骤,将所述朗读速度输入到引擎语速接口,利用所述引擎语速接口调用所述需调用的TTS引擎对应的语速调整模型生成所述TTS引擎的输出语速;/n语音输出步骤,调用所述需调用的TTS引擎以所述输出语速进行语音输出;/n其中,所述语速调整模型如下式所示:/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京光年无限科技有限公司,未经北京光年无限科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610898765.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 播放语速管理方法及装置-201610412991.3
- 周海 - 北京云知声信息技术有限公司
- 2016-06-13 - 2020-02-07 - G10L13/033
- 本发明是关于一种播放语速管理方法及装置,其中,方法包括:获取待播放的TTS播放文本;判断所述TTS播放文本所属的目标领域;确定与所述目标领域对应目标播放语速;按照所述目标播放语速播放所述TTS播放文本。通过该技术方案,获取待播放的TTS播放文本,并根据TTS播放文本所属的目标领域为其确定对应的目标播放语速,从而按照目标播放语速播放TTS播放文本,这样,不同的领域采用不同的语速播放,可以有针对性的进行播放,而不是所有文本都采用一种语速播放,从而保证用户在任何场景下都可以听清楚播放文本播放的内容,提升用户的使用体验。
- 基于智能机器人的多TTS引擎输出语速调节方法及系统-201610898765.0
- 王合心 - 北京光年无限科技有限公司
- 2016-10-14 - 2020-02-07 - G10L13/033
- 一种基于智能机器人的多TTS引擎输出语速调节方法及系统,其中,该方法包括:朗读速度确定步骤,接收多模态交互数据,对多模态交互数据进行解析,确定出需调用的TTS引擎的类型和朗读速度;输出语速确定步骤,基于语速调整模型及需调用的TTS引擎的类型和朗读速度计算需调用的TTS引擎的输出语速;语音输出步骤,调用需调用的TTS引擎以输出语速进行语音输出。相较于现有的多TTS引擎输出语速调节方法,本方法不再需要用户来对各个TTS引擎分别进行相关参数的设置,而是能够使用同一套语速调节方案来实现对不同的TTS引擎的速度设置,从而提高了多TTS引擎输出语速调节的高效性和便捷性。
- 一种提示音生成方法和装置、移动终端-201611209801.4
- 曾庆庚 - 北京安云世纪科技有限公司
- 2016-12-23 - 2020-02-07 - G10L13/033
- 本发明提供了一种提示音生成方法和装置、移动终端,该方法包括:获取应用程序中需要播放的原始提示信息;提取所述原始提示信息所对应的文字信息;根据提取的文字信息和选定模拟用户信息,从全局语音库中获取所述文字信息中每个文字的选定模拟用户的发音;所述全局语音库中包括每个模拟用户对应的各文字的发音;将获取的每个文字的选定模拟用户的发音进行声音合成,生成以模拟用户声音播放的模拟提示音。能够方便用户随心所欲的将应用程序中的提示音转化成自己希望的声音,实现简单方便,灵活性强。
- 专利分类