[发明专利]语音处理方法、服务器、语音处理系统和存储介质在审

申请号：	202110458108.5	申请日：	2021-04-27
公开（公告）号：	CN113053394A	公开（公告）日：	2021-06-29
发明（设计）人：	胡梓垣;翁志伟;张又亮	申请（专利权）人：	广州小鹏汽车科技有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/18;G06F40/289;G06F40/247
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	邵泳城
地址：	510640 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法服务器系统存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种语音处理方法、服务器、语音处理系统和存储介质。语音处理方法包括：转换语音请求为文本数据，并对文本数据分词以获取分词数据；匹配分词数据与预设分组数据，预设分组数据的获得包括：将实体词分成若干小组，每个小组包括若干短语，短语之间是同义词或者近义词关系，各个小组中任意一个短语可按原语序构成实体词；根据匹配结果计算语音请求的匹配度值；在语音请求的匹配度值大于预设匹配度值时，对语音请求进行自然语言理解。上述语音处理方法，可在预设分组数据中添加较少相似的说法，就可支持用户的泛化说法，提高了自然语言理解的泛化效果。

技术领域

本发明涉及语音技术领域，特别涉及一种语音处理方法、服务器、语音处理系统和存储介质。

背景技术

自然语言理解(Natural Language Understanding，NLU)的泛化是一个业界难题，特别是模板匹配过程中，多一个字，少一个字都造成了匹配不上的问题。例如用户想搜附近的充电桩，他会有很多说法，例如：搜索最近的充电桩，搜索旁边的充电站，搜索周边的充电点等等，给NLU带来很大的难度。

发明内容

本发明实施方式提供一种语音处理方法、服务器、语音处理系统和存储介质。

本发明实施方式提供的一种语音处理方法，用于服务器，所述语音处理方法包括：

转换语音请求为文本数据，并对所述文本数据分词以获取分词数据；

匹配所述分词数据与预设分组数据，所述预设分组数据的获得包括：将实体词分成若干小组，每个小组包括若干短语，所述短语之间是同义词或者近义词关系，各个小组中任意一个短语可按原语序构成所述实体词；

根据匹配结果计算所述语音请求的匹配度值；

在所述语音请求的匹配度值大于预设匹配度值时，对所述语音请求进行自然语言理解。

在某些实施方式中，对所述文本数据分词以获取分词数据，包括：

根据短语规则对所述文本数据分词。

在某些实施方式中，所述短语规则包括自定义分词表。

在某些实施方式中，匹配所述分词数据与预设分组数据，包括：

比较每个小组的短语与所述分词数据的每个分词以将所述分词数据的每个分词匹配到所述小组。