[发明专利]用于处理语音的方法和装置在审

申请号：	202010779755.1	申请日：	2020-08-05
公开（公告）号：	CN111916065A	公开（公告）日：	2020-11-10
发明（设计）人：	唐子杰	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/14;G06K9/62;G06N20/00
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于处理语音方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于处理语音的方法，包括：

接收用户通过终端发送的用户音频；

对所述用户音频进行分类，得到所述用户音频的音频分类信息；

根据所述音频分类信息和预设的匹配关系信息，确定与所述音频分类信息相匹配的匹配音频分类信息为目标匹配音频分类信息，其中，所述匹配关系信息用于表征音频分类信息与匹配音频分类信息之间的匹配关系。

2.根据权利要求1所述的方法，其中，所述方法还包括：

基于所述目标匹配音频分类信息，确定所述终端安装的预设客户端所播放语音的音色。

3.根据权利要求1所述的方法，其中，所述方法还包括：

根据所述目标匹配音频分类信息，从预设的音频信息集合中确定至少一条音频信息作为目标音频信息；

将所述目标音频信息推送到所述终端。

4.根据权利要求3所述的方法，其中，所述匹配关系信息包括音频分类信息和匹配音频分类信息，以及音频分类信息与匹配音频分类信息所对应音频之间的匹配度；以及

所述方法还包括：

接收所述终端发送的所述用户针对所推送的音频信息的操作信息；

基于所述操作信息，调整所述匹配关系信息中的匹配度。

5.根据权利要求1所述的方法，其中，所述对所述用户音频进行分类，得到所述用户音频的音频分类信息，包括：

将所述用户音频输入预先建立的音频分类模型，得到所述用户音频的音频分类信息，其中，所述音频分类模型用于表征音频信息与音频分类信息之间的对应关系。

6.根据权利要求1所述的方法，其中，所述方法还包括：

基于所述音频分类信息和所述匹配关系信息，确定与所述音频分类信息的匹配度满足预设条件的匹配音频分类信息为待显示匹配音频分类信息；

向所述终端发送所述待显示匹配音频分类信息，以供所述终端显示给所述用户。

7.根据权利要求1所述的方法，其中，所述方法还包括：

确定所述用户音频与预设的目标人物音频集合中的目标人物音频的相似度，其中，所述目标人物音频集合包括至少一名目标人物的音频；

根据所述相似度，从所述至少一名目标人物中选取出目标人物作为相似人物；

向所述终端发送所述相似人物的名称。

8.一种用于处理语音的装置，包括：

接收单元，被配置成接收用户通过终端发送的用户音频；

分类单元，被配置成对所述用户音频进行分类，得到所述用户音频的音频分类信息；

确定单元，被配置成根据所述音频分类信息和预设的匹配关系信息，确定与所述音频分类信息相匹配的匹配音频分类信息为目标匹配音频分类信息，其中，所述匹配关系信息用于表征音频分类信息与匹配音频分类信息之间的匹配关系。

9.根据权利要求8所述的装置，其中，所述装置还包括：

音色确定单元，被配置成基于所述目标匹配音频分类信息，确定所述终端安装的预设客户端所播放语音的音色。

10.根据权利要求8所述的装置，其中，所述装置还包括：

信息确定单元，被配置成根据所述目标匹配音频分类信息，从预设的音频信息集合中确定至少一条音频信息作为目标音频信息；

推送单元，被配置成将所述目标音频信息推送到所述终端。

11.根据权利要求10所述的装置，其中，所述匹配关系信息包括音频分类信息和匹配音频分类信息，以及音频分类信息与匹配音频分类信息所对应音频之间的匹配度；以及

所述装置还包括：

信息接收单元，被配置成接收所述终端发送的所述用户针对所推送的音频信息的操作信息；

调整单元，被配置成基于所述操作信息，调整所述匹配关系信息中的匹配度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010779755.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种高炉放残铁钻孔的专业工具
下一篇：基于VPN的水电气集中器远程访问方法、装置和系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于处理语音的方法和装置在审

专利文献下载