[发明专利]一种语音识别方法及装置有效

申请号：	201810261214.2	申请日：	2018-03-28
公开（公告）号：	CN108717851B	公开（公告）日：	2021-04-06
发明（设计）人：	梁立修	申请（专利权）人：	深圳市三诺数字科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L25/51
代理公司：	深圳市世联合知识产权代理有限公司 44385	代理人：	汪琳琳
地址：	518000 广东省深圳市宝安区松***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音识别方法及装置，涉及语音识别技术领域，该语音识别方法及装置包括：获取用户当前智能终端的存储权限以及调用所述智能终端上的音频数据，对所述音频数据进行解析确定用户的特征音频信息；实时获取用户当前输入的语音数据，并将所获取的语音数据与所述特征音频信息进行比对，识别出用户输入的语音数据并以文字的形式显示在所述智能终端上。该过程极大的提高了语音识别的准确率，即便是普通话不标准的用户也具备适用性，提高了用户的使用体验。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音识别方法及装置。

背景技术

得益于深度学习与人工神经网络的发展，语音识别在近年取得了一系列突破性的进展，在产品应用上也越来越成熟。作为语音交互领域中极其重要的一环，语音识别一直是研究的重点，且现有的语音识别技术在识别准确率上有较高的突破，识别成功率最高可达97％。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：然而上述的高准确率需要基于一个基础，即输入语音要与其数据库模型的语音相一致，而现实中，由于我国幅员辽阔，方言众多，用户的口音各不相同，即使说着普通话，也各自带着家乡的口音，从而造成其语音输入的文字不准确，无法表达原意。

发明内容

为了克服现有技术中相关产品的不足，本发明提出一种语音识别方法及装置，解决现有的语音识别方法在用户的语音与数据库模型不一致时导致出现识别错误的问题。

本发明提供了一种语音识别方法，应用于智能终端，包括：

获取用户当前智能终端的存储权限以及调用所述智能终端上的音频数据，对所述音频数据进行解析确定用户的特征音频信息；

实时获取用户当前输入的语音数据，并将所获取的语音数据与所述特征音频信息进行比对，识别出用户输入的语音数据并以文字的形式显示在所述智能终端上。

在一些可能的实施方式中，所述对所述音频数据进行解析确定用户的特征音频信息包括：

分别对所有的音频数据进行解析并判断是否符合预设条件；