[发明专利]语音音频处理方法、装置及电子设备在审
申请号: | 202111565295.3 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114495893A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 许林林 | 申请(专利权)人: | 青岛海尔科技有限公司;海尔智家股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/02;G10L15/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 任少瑞 |
地址: | 266101 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 音频 处理 方法 装置 电子设备 | ||
本发明提供一种语音音频处理方法、装置及电子设备,该方法包括:基于目标发音人的目标语料,生成目标发音人对应的目标音频资源包;在接收到第一电子设备发送的表示请求下载目标音频资源包的下载请求的情况下,将目标音频资源包发送至第一电子设备,目标音频资源包用于生成与目标发音人对应的应答语音;其中,目标音频资源包包括至少一条语音音频,语音音频的播报音色为目标发音人的音色;目标语料包括目标发音人发出的语音形式的语料,目标语料的语料内容包括预先确定的短语、语句、短篇和曲调中的至少一种。本发明提供的语音音频处理方法、装置及电子设备,能简化语音音频处理的过程,能提高语音音频处理的效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音音频处理方法、装置及电子设备。
背景技术
随着科学技术的发展,语音交互应用于越来越多的电子设备中,例如:移动通讯第一电子设备、汽车以及智能家居产品等。相较于基于用户手动操作的交互方式,语音交互的更简便、使用门槛更低、感官占用更少、输入效率更高并能传递更多的声学信息,提高了用户体验。
通常情况下,具有语音交互功能的电子设备仅能以少数几个通用音色进行语音播报。在用户对电子设备进行语音播报的音色有定制化需求的情况下(例如:用户希望电子设备以某个人的音色进行语音播报),现有技术中可以通过录制发音人的语音音频,并基于上述语音音频和深度学习技术,实现电子设备以上述发音人的音色进行语音播报。但是,为了避免电子设备以上述发音人的音色进行语音播报时音色失真,通常需要采集大量上述发音人的语音音频用于生成播报音色为上述发音人的音色的应答语音,且对上述语音音频的音频质量要求较高,需要投入大量的时间成本,语音音频处理的效率较低。
发明内容
本发明提供一种语音音频处理方法、装置及电子设备,用以解决现有技术中进行语音音频处理的效率较低的缺陷,实现更高效的语音音频处理。
本发明提供一种语音音频处理方法,包括:获取目标发音人的目标语料;基于所述目标语料,生成所述目标发音人对应的目标音频资源包;在接收到第一电子设备发送的表示请求下载所述目标音频资源包的下载请求的情况下,将所述目标音频资源包发送至第一电子设备,所述目标音频资源包用于生成与所述目标发音人对应的应答语音;其中,所述目标音频资源包包括至少一条语音音频,所述语音音频的播报音色为所述目标发音人的音色;所述目标语料包括所述目标发音人发出的语音形式的语料,所述目标语料的语料内容包括预先确定的短语、语句、短篇和曲调中的至少一种。
本发明还提供一种语音音频处理方法,包括:根据接收到的语音指令的声纹特征,确定所述语音指令对应的目标发音人;在网络状态满足特定条件时,查找与述目标发音人对应的目标音频资源包;根据所述语音指令的处理结果,从所述目标音频资源包中确定目标语音音频,并基于所述处理结果和所述目标语音音频合成应答语音,并播报所述应答语音。
本发明还提供一种语音音频处理装置,包括:语料获取模块,用于获取目标发音人的目标语料;资源包生成模块,用于基于所述目标语料,生成所述目标发音人对应的目标音频资源包;资源包发送模块,用于在接收到第一电子设备发送的表示请求下载所述目标音频资源包的下载请求的情况下,将所述目标音频资源包发送至第一电子设备,所述目标音频资源包用于生成与所述目标发音人对应的应答语音;其中,所述目标音频资源包包括至少一条语音音频,所述语音音频的播报音色为所述目标发音人的音色;所述目标语料包括所述目标发音人发出的语音形式的语料,所述目标语料的语料内容包括预先确定的短语、语句、短篇和曲调中的至少一种。
本发明还提供一种语音音频处理装置,包括:通信模块,用于根据接收到的语音指令的声纹特征,确定所述语音指令对应的目标发音人;查询模块,用于在网络状态满足特定条件时,查找与所述目标发音人对应的目标音频资源包;播报模块,用于根据所述语音指令的处理结果,从所述目标音频资源包中确定目标语音音频,并基于所述处理结果和所述目标语音音频合成应答语音,并播报所述应答语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海尔科技有限公司;海尔智家股份有限公司,未经青岛海尔科技有限公司;海尔智家股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565295.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油烟机控制方法、系统及装置
- 下一篇:一种电动赛车集成式减速箱