[发明专利]用于处理语音的方法和装置在审
申请号: | 202010779755.1 | 申请日: | 2020-08-05 |
公开(公告)号: | CN111916065A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 唐子杰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/14;G06K9/62;G06N20/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 语音 方法 装置 | ||
1.一种用于处理语音的方法,包括:
接收用户通过终端发送的用户音频;
对所述用户音频进行分类,得到所述用户音频的音频分类信息;
根据所述音频分类信息和预设的匹配关系信息,确定与所述音频分类信息相匹配的匹配音频分类信息为目标匹配音频分类信息,其中,所述匹配关系信息用于表征音频分类信息与匹配音频分类信息之间的匹配关系。
2.根据权利要求1所述的方法,其中,所述方法还包括:
基于所述目标匹配音频分类信息,确定所述终端安装的预设客户端所播放语音的音色。
3.根据权利要求1所述的方法,其中,所述方法还包括:
根据所述目标匹配音频分类信息,从预设的音频信息集合中确定至少一条音频信息作为目标音频信息;
将所述目标音频信息推送到所述终端。
4.根据权利要求3所述的方法,其中,所述匹配关系信息包括音频分类信息和匹配音频分类信息,以及音频分类信息与匹配音频分类信息所对应音频之间的匹配度;以及
所述方法还包括:
接收所述终端发送的所述用户针对所推送的音频信息的操作信息;
基于所述操作信息,调整所述匹配关系信息中的匹配度。
5.根据权利要求1所述的方法,其中,所述对所述用户音频进行分类,得到所述用户音频的音频分类信息,包括:
将所述用户音频输入预先建立的音频分类模型,得到所述用户音频的音频分类信息,其中,所述音频分类模型用于表征音频信息与音频分类信息之间的对应关系。
6.根据权利要求1所述的方法,其中,所述方法还包括:
基于所述音频分类信息和所述匹配关系信息,确定与所述音频分类信息的匹配度满足预设条件的匹配音频分类信息为待显示匹配音频分类信息;
向所述终端发送所述待显示匹配音频分类信息,以供所述终端显示给所述用户。
7.根据权利要求1所述的方法,其中,所述方法还包括:
确定所述用户音频与预设的目标人物音频集合中的目标人物音频的相似度,其中,所述目标人物音频集合包括至少一名目标人物的音频;
根据所述相似度,从所述至少一名目标人物中选取出目标人物作为相似人物;
向所述终端发送所述相似人物的名称。
8.一种用于处理语音的装置,包括:
接收单元,被配置成接收用户通过终端发送的用户音频;
分类单元,被配置成对所述用户音频进行分类,得到所述用户音频的音频分类信息;
确定单元,被配置成根据所述音频分类信息和预设的匹配关系信息,确定与所述音频分类信息相匹配的匹配音频分类信息为目标匹配音频分类信息,其中,所述匹配关系信息用于表征音频分类信息与匹配音频分类信息之间的匹配关系。
9.根据权利要求8所述的装置,其中,所述装置还包括:
音色确定单元,被配置成基于所述目标匹配音频分类信息,确定所述终端安装的预设客户端所播放语音的音色。
10.根据权利要求8所述的装置,其中,所述装置还包括:
信息确定单元,被配置成根据所述目标匹配音频分类信息,从预设的音频信息集合中确定至少一条音频信息作为目标音频信息;
推送单元,被配置成将所述目标音频信息推送到所述终端。
11.根据权利要求10所述的装置,其中,所述匹配关系信息包括音频分类信息和匹配音频分类信息,以及音频分类信息与匹配音频分类信息所对应音频之间的匹配度;以及
所述装置还包括:
信息接收单元,被配置成接收所述终端发送的所述用户针对所推送的音频信息的操作信息;
调整单元,被配置成基于所述操作信息,调整所述匹配关系信息中的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010779755.1/1.html,转载请声明来源钻瓜专利网。