[发明专利]音频生成方法、装置、非易失性存储介质及计算机设备在审
申请号: | 202210957627.0 | 申请日: | 2022-08-10 |
公开(公告)号: | CN115294957A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 尹勇;罗涛 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L25/30;G06F16/33 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 生成 方法 装置 非易失性 存储 介质 计算机 设备 | ||
1.一种音频生成方法,其特征在于,包括:
接收目标对象的文本语音转换请求;
响应所述文本语音转换请求,获取目标文本和所述文本语音转换请求对应的目标渠道类别;
确定与所述目标渠道类别相匹配的目标多音字词汇库;
基于所述目标多音字词汇库,生成所述目标文本对应的语音音频。
2.根据权利要求1所述的方法,其特征在于,所述响应所述文本语音转换请求,获取所述文本语音转换请求对应的渠道类别,包括:
响应所述文本语音转换请求,确定所述目标对象发送所述文本语音转换请求所采用的目标渠道;
根据渠道分类规则,确定所述目标渠道对应的渠道类别为所述目标渠道类别;
确定与所述目标渠道类别匹配的多音字词汇库为所述目标多音字词汇库。
3.根据权利要求2所述的方法,其特征在于,所述根据渠道分类规则,确定所述目标渠道对应的渠道类别为所述目标渠道类别,包括:
获取所述目标渠道对应的渠道常用字词;
分析所述渠道常用字词,得到所述目标渠道的渠道特征信息;
根据所述渠道特征信息和渠道分类规则,确定所述目标渠道对应的所述目标渠道类别。
4.根据权利要求2所述的方法,其特征在于,所述确定与所述目标渠道类别匹配的多音字词汇库为所述目标多音字词汇库,包括:
获取多个多音字词汇库各自的词汇库特征,其中,所述词汇库特征用于表示多音字词汇库适用的渠道类别;
根据所述目标渠道类别与所述词汇库特征的匹配结果,确定所述多个多音字词汇库中与所述目标渠道类别匹配的所述目标多音字词汇库。
5.根据权利要求2所述的方法,其特征在于,所述确定与所述目标渠道类别相匹配的目标多音字词汇库,包括:
向所述目标渠道发送词汇库获取请求;
接受所述目标渠道返回的词汇库为所述目标多音字词汇库。
6.根据权利要求1所述的方法,其特征在于,所述响应所述文本语音转换请求,获取目标文本和所述文本语音转换请求对应的目标渠道类别,包括:
响应所述文本语音转换请求,获取所述目标文本;
从所述目标文本中提取文本关键字;
分析所述文本关键字,得到所述文本语音转换请求对应的所述目标渠道类别。
7.根据权利要求1所述的方法,其特征在于,还包括:
获取目标对象对所述语音音频的反馈信息,其中,所述反馈信息包括显性反馈和隐性反馈;
根据所述反馈信息,维护所述目标多音字词汇库。
8.一种音频生成装置,其特征在于,包括:
接收模块,用于接收目标对象的文本语音转换请求;
响应模块,用于响应所述文本语音转换请求,获取目标文本和所述文本语音转换请求对应的目标渠道类别;
确定模块,用于确定与所述目标渠道类别相匹配的目标多音字词汇库;
生成模块,用于基于所述目标多音字词汇库,生成所述目标文本对应的语音音频。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述音频生成方法。
10.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述音频生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210957627.0/1.html,转载请声明来源钻瓜专利网。