[发明专利]一种文本转语音的处理方法、终端及服务器在审
申请号: | 201911404905.4 | 申请日: | 2019-12-30 |
公开(公告)号: | CN113129861A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 刘涛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/047 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 陈斌 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 语音 处理 方法 终端 服务器 | ||
一种文本转语音的处理方法、终端及服务器,用以降低终端播放语音的时延。本文方法及装置可应用于人工智能、人机交互等领域。其中,终端检测到用于指示文本转语音的指令;将所述文本发送服务器;从所述服务器下载由所述文本转换而成的音频数据;判断预设时长内是否下载到首帧可以播放的音频数据;若预设时长内下载到首帧可以播放的音频数据,继续下载剩余的音频数据。
技术领域
本申请涉及音频技术领域,尤其涉及一种文本转语音的处理方法、终端及服务器。
背景技术
目前,文本到语音(text to speech,TTS)技术成为人机对话的重要技术,实现了“让机器说话”的目的。TTS技术的用途很广,包括电子邮件的阅读、语音助手、语音提示等等。
TTS技术主要是将每个文字转换成对应的语音,然后将语音拼接(或称为合成)为音频流来播放。目前,语音合成主要包括离线合成和在线合成。离线合成可以由终端自行实现,但是需要终端内存储海量文字对应的语音。在线合成可以是服务器合成。具体来说,终端连接到服务器,将文本发送服务器,服务器将文本对应的音频合成音频流之后,将音频流发送给终端播放。
但是,在线合成过程中,服务器返回音频流的时间无法控制。例如,终端连接服务器之后,服务器合成音频流较慢,花费较长时间才返回音频流,导致终端播放音频的时延较长,影响用户体验。
发明内容
本申请的目的在于提供了一种文本转语音的处理方法、终端以及服务器,用以降低终端播放语音的时延。
第一方面,提供一种文本转语音的处理方法,该方法可以由终端执行或者由终端中的芯片执行。该方法包括:检测到用于指示文本转语音的指令;将所述文本发送服务器;从所述服务器下载由所述文本转换而成的音频数据;判断预设时长内是否下载到首帧可以播放的音频数据;若预设时长内下载到首帧可以播放的音频数据,继续下载剩余的音频数据。
应理解,终端或服务器的网络质量动态变化,网络质量较好时,终端下载速度较快,网络质量较差时,可能下载速度较慢。在本申请实施例中,终端将文本发送服务器,以请求服务器实现文本转语音之后,终端从服务器下载语音数据。如果预设时长内下载了首帧可以播放的音频数据,则继续下载剩余的音频数据。否则在离线数据库中确定所述文本对应的音频信号,并将所述音频信号合成音频数据。因此,尽可能的缩短终端语音播放的时延,以避免用户输入文本转语音的指示之后,迟迟无法播放出语音的情况。
其中,所述首帧可以播放的音频数据可以为首次下载的包括预设长度的音频数据。或者,所述首帧可以播放的音频数据可以为首次下载的包括至少一帧完整音频的数据。
在本申请实施例中,终端与服务器约定压缩策略,例如预定服务器每次压缩的音频数据的数据长度相同,且为预设长度;还可以约定服务器每次压缩的音频数据中包括至少一帧完整的音频。这样的话,终端每次下载预设长度的音频数据,而且每次下载的音频数据都包括至少一帧完整的音频。也就是说,终端在预设时长内首次下载到预设长度的音频数据,或者,首次下载到包括至少一帧完整音频的数据时,可以继续下载剩余音频数据,否则使用离线合成方式。因此,尽可能的缩短终端语音播放的时延,以避免用户输入文本转语音的指示之后,迟迟无法播放出语音的情况。
在一种可能的设计中,终端还可以:将下载的音频数据存储到缓存区域中;确定所述缓存区域内的音频数据的内存占用量达到门限时,播放所述首帧可以播放的音频数据。
应理解,缓存区域中存储的一定数量的音频数据,可以保证播放首帧可以播放的音频数据之后,继续播放下一帧音频数据,以确保首帧播放完毕,不卡顿。
在一些实施例中,终端播放所述首帧可以播放的音频数据,包括:将所述首帧可以播放的音频数据传递给解析器进行解析,得到解压后的音频数据;将经过解析器解析后的音频数据传递给解码器进行解码,得到预设音频格式的音频数据;将经过解码器解码后的音频数据传递给播放器播放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404905.4/2.html,转载请声明来源钻瓜专利网。