[发明专利]语音处理方法、终端设备及存储介质在审

申请号：	202011334384.2	申请日：	2020-11-24
公开（公告）号：	CN112489619A	公开（公告）日：	2021-03-12
发明（设计）人：	刘沙沙	申请（专利权）人：	上海传英信息技术有限公司
主分类号：	G10L13/047	分类号：	G10L13/047;G10L13/04;G10L13/08
代理公司：	深圳市嘉勤知识产权代理有限公司 44651	代理人：	王敏生
地址：	201203 上海市浦东新区中国***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法终端设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开一种语音处理方法、终端设备及存储介质。所述语音处理方法包括：S11、获取用户的预设特征信息；S12、根据预设特征信息确定语音播报时的目标语音风格。本申请不仅能够根据用户当前状态自动切换适应的语音风格，而且能够提供丰富的语音风格，有利于提高语音播放的质量。

技术领域

本申请涉及语音处理与合成技术领域，尤其涉及一种语音处理方法、以及基于该语音处理方法的终端设备和可读存储介质。

背景技术

近年来，随着在线音像市场的不断发展，语音处理与语音合成技术已经广泛的应用于人们的日常生活中，例如线儿童读物、在线小说、在线评书、在线新闻等。但是，当前基于语音处理与合成技术的语音播放，大都是机械的、无感情的、平铺直叙的、毫无起伏的朗读文本内容，局限于将文字转换成能让人听懂的语音，缺乏丰富的语音风格，并且无法根据用户的当前状态自动切换适应的语音风格，无法进一步地提高语音播放的质量。

前面的叙述在于提供一般的背景信息，并不一定构成现有技术。

发明内容

鉴于此，本申请提供一种语音处理方法、终端设备及存储介质，以解决无法根据用户状态选取适应的语音风格实现语音播放的问题。

本申请提供的一种语音处理方法，包括：

S11、获取用户的预设特征信息；

S12、根据用户的预设特征信息确定语音播报时的目标语音风格。

可选地，所述预设特征信息包括以下至少一种：作息信息、情境信息、情感特征、性格特征、性别、年龄。

可选地，所述S11步骤包括以下至少一种：

根据选择操作和/或输入操作获取预设特征信息；

根据历史习惯和/或传感器获取预设特征信息；

获取用户的语音数据，并根据语音数据获取预设特征信息。

可选的，所述S12步骤之前，还包括：根据所述目标语音风格选择适配的待播放文档，识别并提取待播放文档中的文本内容，和/或，对所述文本内容进行语音合成，生成具有所述目标语音风格的语音文档；