[发明专利]语音识别方法及装置在审

专利信息
申请号: 201710995212.1 申请日: 2017-10-23
公开(公告)号: CN107564525A 公开(公告)日: 2018-01-09
发明(设计)人: 李明;张勇 申请(专利权)人: 深圳北鱼信息科技有限公司
主分类号: G10L15/22 分类号: G10L15/22;G10L15/30
代理公司: 北京超凡志成知识产权代理事务所(普通合伙)11371 代理人: 王术兰
地址: 518000 广东省深圳市南山区粤海*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 装置
【说明书】:

技术领域

发明属于语音识别技术领域,具体涉及语音识别方法及装置。

背景技术

随着语音识别设备的广泛使用,如何高效提高语音识别的准确率变得日趋重要,目前的语音识别有两类方式,一类是云端在线识别,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过通讯模组上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用,一旦网络环境不佳,将产生无法识别或者反馈延时的状况;另一类是本地识别,该方式通过本地识别模组进行的本地语音控制命令词的识别,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,无法实现自由对讲,体验感不高。

发明内容

本发明的目的在于针对现有技术的不足,提供一种语音识别方法及装置,用于克服现有技术中的缺点。

具体的,本发明提出了以下具体的实施例:

本发明实施例提供了一种语音识别方法,包括:

获取用户发送的语音指令;

将所述语音指令的音频流发送给本地识别引擎;

接收所述本地识别引擎返回的本地识别结果;

当本地识别结果不在预设范围内时,将所述语音指令的音频流发送给云端识别引擎;

接收所述云端识别引擎返回的云端识别结果;

当云端识别结果在预设范围内时,执行所述语音指令。

作为上述技术方案的进一步改进,所述本地识别结果不在预设范围内具体为:所述本地识别结果对应的置信度小于第一预设置信度区间上限;所述云端识别结果在预设范围内具体为:所述云端识别结果对应的置信度大于第二预设置信度区间上限。

作为上述技术方案的进一步改进,所述方法还包括:循环执行所述将所述语音指令发送给云端识别引擎,直至所述云端识别引擎返回的云端识别结果在预设范围内或者重发次数达到最大发送次数。

作为上述技术方案的进一步改进,所述方法还包括:在初始化和/或根据用户输入,设置所述最大发送次数。

作为上述技术方案的进一步改进,所述方法还包括:接收到用户发送的语音指令后,开启所述本地识别引擎,当本地识别结果不在预设范围内时,开启所述云端识别引擎。

本发明实施例还提供了一种语音识别装置,包括:

语音获取模块,用于获取用户发送的语音指令;

第一发送模块,用于将所述语音指令的音频流发送给本地识别引擎;

第一接收模块,用于接收所述本地识别引擎返回的本地识别结果;

第一判断模块,用于判断所述本地识别结果是否在预设范围内,当本地识别结果在预设范围内时,执行所述语音指令,当本地识别结果不在预设范围内时,执行云端识别;

第二发送模块,用于所述第一判断模块判断本地识别结果不在预设范围内时将所述语音指令的音频流发送给云端识别引擎;

第二接收模块,用于接收所述云端识别引擎返回的云端识别结果;

第二判断模块,用于判断所述云端识别结果是否在预设范围内,当云端识别结果在预设范围内时,执行所述语音指令,当云端识别结果不在预设范围内时,则发出无效指令提示;

执行模块,用于执行所述语音指令。

作为上述技术方案的进一步改进,所述第一判断模块判定本地识别结果不在预设范围内的依据具体为:所述本地识别结果对应的置信度小于第一预设置信度区间上限;所述第二判断模块判定云端识别结果在预设范围内的依据具体为:所述云端识别结果对应的置信度大于第二预设置信度区间上限。

作为上述技术方案的进一步改进,还包括重发模块,用于循环执行所述将所述语音指令发送给云端识别引擎,直至所述云端识别引擎返回的云端识别结果在预设范围内或者重发次数达到最大发送次数。

作为上述技术方案的进一步改进,还包括设置模块,用于在初始化和/或根据用户输入,设置所述最大发送次数。

作为上述技术方案的进一步改进,还包括触发模块,用于在接收到用户发送的语音指令后,开启所述本地识别引擎,当本地识别结果不在预设范围内时,开启所述云端识别引擎。

采用本发明提供的技术方案,与已有的公知技术相比,至少具有如下有益效果:响应速度快和控制简单。本地识别不成功后将所述语音指令上送云端进行识别,消耗的网络数据流量比每次上送云端识别更加节省流量。保证语音指令能够有效识别。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北鱼信息科技有限公司,未经深圳北鱼信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710995212.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top