[发明专利]语音输出方法、终端及计算机可读存储介质在审

申请号：	201811632187.1	申请日：	2018-12-28
公开（公告）号：	CN109686359A	公开（公告）日：	2019-04-26
发明（设计）人：	李春宝	申请（专利权）人：	努比亚技术有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/033;G10L13/08;G10L13/10
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518057 广东省深圳市南山区高新区北环大道9018***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	朗读触控操作控件侦测计算机可读存储介质语音朗读语音输出语音文本终端语音合成模型个性化需求用户调节用户体验输出合成指令
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音输出方法，该方法包括：在接收到启动朗读功能的指令时，获取待朗读文本，并通过训练好的语音合成模型合成所述待朗读文本对应的语音；输出所述语音，以及，显示朗读速度控件；侦测作用于所述朗读速度控件的触控操作；在侦测到作用于所述朗读速度控件的触控操作时，根据侦测到的触控操作调整所述语音的输出速度。本发明还公开了一种终端及计算机可读存储介质。本发明能够增强语音朗读的自然感，且能够满足用户调节语音朗读速度的个性化需求，从而提升了用户体验。

技术领域

本发明涉及互联网技术领域，尤其涉及一种语音输出方法、终端及计算机可读存储介质。

背景技术

随着移动互联网的发展，对语音技术的利用越来越多，语音朗读也越来越普及。比如等车、坐车、环境光线昏暗的场景下，进行视觉阅读不是很方便，而语音朗读使得用户可以随心所欲地听书籍、新闻、查阅的资料等。然而，现在的语音朗读一般是调用语音模块按照默认的语速进行逐字输出，这种输出结果用户听起来较为机械和单调，用户体验不佳。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种语音输出方法、终端及计算机可读存储介质，旨在解决现有的语音朗读较为机械和单调，用户体验不佳的技术问题。

为实现上述目的，本发明提供一种语音输出方法，所述语音输出方法包括以下步骤：

在接收到启动朗读功能的指令时，获取待朗读文本，并通过训练好的语音合成模型合成所述待朗读文本对应的语音；

输出所述语音，以及，显示朗读速度控件；

侦测作用于所述朗读速度控件的触控操作；

在侦测到作用于所述朗读速度控件的触控操作时，根据侦测到的触控操作调整所述语音的输出速度。

可选地，所述训练好的语音合成模型包括训练好的韵律分析模型和训练好的声学模型，

所述通过训练好的语音合成模型合成所述待朗读文本对应的语音的步骤包括：

通过训练好的韵律分析模型，提取所述待朗读文本对应的文本特征向量；

将所述文本特征向量输入至训练好的声学模型中，得到训练好的声学模型输出的声学特征向量；