[发明专利]语音处理方法、终端设备及存储介质在审
申请号: | 202011334384.2 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112489619A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 刘沙沙 | 申请(专利权)人: | 上海传英信息技术有限公司 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/04;G10L13/08 |
代理公司: | 深圳市嘉勤知识产权代理有限公司 44651 | 代理人: | 王敏生 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 终端设备 存储 介质 | ||
本申请公开一种语音处理方法、终端设备及存储介质。所述语音处理方法包括:S11、获取用户的预设特征信息;S12、根据预设特征信息确定语音播报时的目标语音风格。本申请不仅能够根据用户当前状态自动切换适应的语音风格,而且能够提供丰富的语音风格,有利于提高语音播放的质量。
技术领域
本申请涉及语音处理与合成技术领域,尤其涉及一种语音处理方法、以及基于该语音处理方法的终端设备和可读存储介质。
背景技术
近年来,随着在线音像市场的不断发展,语音处理与语音合成技术已经广泛的应用于人们的日常生活中,例如线儿童读物、在线小说、在线评书、在线新闻等。但是,当前基于语音处理与合成技术的语音播放,大都是机械的、无感情的、平铺直叙的、毫无起伏的朗读文本内容,局限于将文字转换成能让人听懂的语音,缺乏丰富的语音风格,并且无法根据用户的当前状态自动切换适应的语音风格,无法进一步地提高语音播放的质量。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
鉴于此,本申请提供一种语音处理方法、终端设备及存储介质,以解决无法根据用户状态选取适应的语音风格实现语音播放的问题。
本申请提供的一种语音处理方法,包括:
S11、获取用户的预设特征信息;
S12、根据用户的预设特征信息确定语音播报时的目标语音风格。
可选地,所述预设特征信息包括以下至少一种:作息信息、情境信息、情感特征、性格特征、性别、年龄。
可选地,所述S11步骤包括以下至少一种:
根据选择操作和/或输入操作获取预设特征信息;
根据历史习惯和/或传感器获取预设特征信息;
获取用户的语音数据,并根据语音数据获取预设特征信息。
可选的,所述S12步骤之前,还包括:根据所述目标语音风格选择适配的待播放文档,识别并提取待播放文档中的文本内容,和/或,对所述文本内容进行语音合成,生成具有所述目标语音风格的语音文档;
可选地,所述方法还包括:识别并提取待播放资源的文本内容;
所述S12步骤之后,包括:对文本内容进行语音合成,生成具有目标语音风格的语音文档。
可选地,所述S12步骤之后,还包括:
根据预设特征信息选择适配的待播放文档;
识别并提取待播放文档中的文本内容;和/或,对文本内容进行语音合成,生成具有目标语音风格的语音文档。
可选地,所述S12步骤之前,还包括:获取待播放文档的预设特征信息;
判断待播放文档的预设特征信息与用户的预设特征信息是否冲突;
若否,则执行所述S12步骤;和/或,
若是,则执行预设策略。
可选地,所述获取待播放文档的预设特征信息,包括以下至少一种:
根据待播放文档的预设分类标签获取其预设特征信息;
根据待播放文档的文本内容确定其预设特征信息。
可选地,所述预设策略包括以下至少一种:
执行所述S12步骤;
根据选择指令确定目标语音风格;
根据待播放文档的预设特征信息确定目标语音风格;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海传英信息技术有限公司,未经上海传英信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011334384.2/2.html,转载请声明来源钻瓜专利网。