[发明专利]一种语音识别方法及装置在审
| 申请号: | 201810751935.1 | 申请日: | 2018-07-10 |
| 公开(公告)号: | CN108899030A | 公开(公告)日: | 2018-11-27 |
| 发明(设计)人: | 徐佳宏;陈欢 | 申请(专利权)人: | 深圳市茁壮网络股份有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F17/30 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518004 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关键词集合 语音数据 匹配 应用场景 语音识别 输出识别 词库 匹配成功 准确率 成功率 词语 申请 成功 | ||
本申请公开了一种语音识别方法及装置,首先确定与当前应用场景对应的关键词集合,然后获取语音数据,将语音数据与关键词集合中的关键词进行识别匹配,若匹配成功,输出识别结果,若匹配不成功,将语音数据与词库中的字词进行识别匹配,并输出识别结果。该语音识别方法及装置由于针对不同的应用场景设置了对应的关键词集合,关键词集合中可以设置对应应用场景中经常使用的词语,因此在特定应用场景下,语音数据与关键词集合中具有针对性的关键词进行匹配的成功率就会很高。这样语音数据只需要在小范围的关键词集合中进行识别匹配,而无需在包含所有字词的词库中进行大范围的识别匹配,能够有效提高语音识别速度和识别准确率,提升用户的使用体验。
技术领域
本发明涉及智能识别,更具体的说,是涉及一种语音识别方法及装置。
背景技术
现在越来越多的电子设备都具备语音识别功能。语音识别功能能够让用户解放双手,降低控制设备过程的复杂度。
语音识别技术的工作原理是,语音采集设备采集用户语音,然后将用户语音发送给语音识别系统,语音识别系统从词库中找到发音最相似的汉字或词语组合为语音识别结果。但是,由于词库中包含所有字、词语甚至是语句,语音识别系统在识别语音的过程中,需要将用户语音与大量的字词进行匹配,这就导致语音识别速度比较慢。且中国的汉字同音字非常多,如青色和青涩,这就使得识别出的结果常常与实际情况不符,识别准确率低。
发明内容
有鉴于此,本发明提供了一种语音识别方法及装置,以克服现有技术中语音识别速度慢,识别准确率低的问题。
为实现上述目的,本发明提供如下技术方案:
一种语音识别方法,包括:
确定与当前应用场景对应的关键词集合;
获取语音数据;
将所述语音数据与所述关键词集合中的关键词进行识别匹配;
若匹配成功,输出识别结果;
若匹配不成功,将所述语音数据与词库中的字词进行识别匹配,并输出识别结果。
可选的,所述关键词集合包括通用关键词和场景关键词,则所述将所述语音数据与所述关键词集合中的关键词进行识别匹配,包括:
将所述语音数据与所述关键词集合中的场景关键词进行识别匹配;
若匹配失败,将所述语音数据与所述关键词集合中的通用关键词进行识别匹配。
可选的,还包括:
预先配置好每一个应用场景与关键词集合的对应关系。
可选的,还包括:
将多次识别结果中出现次数满足预设值的词语设定为高频词,并设置在所述关键词集合中关键词队列的前部。
可选的,还包括:
将所述关键词集合中的关键词的同义词添加至所述关键词集合中。
一种语音识别装置,包括:
集合确定模块,用于确定与当前应用场景对应的关键词集合;
语音获取模块,用于获取语音数据;
关键词匹配模块,用于将所述语音数据与所述关键词集合中的关键词进行识别匹配;
结果输出模块,用于在所述关键词匹配模块匹配成功时,输出识别结果;
词库匹配输出模块,用于在所述关键词匹配模块匹配失败时,将所述语音数据与词库中的字词进行识别匹配,并输出识别结果。
可选的,所述关键词集合包括通用关键词和场景关键词,则所述关键词匹配模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市茁壮网络股份有限公司,未经深圳市茁壮网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810751935.1/2.html,转载请声明来源钻瓜专利网。





