[发明专利]一种语音识别引擎自动切换方法和装置有效
申请号: | 201611226504.0 | 申请日: | 2016-12-27 |
公开(公告)号: | CN106710586B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 原树旗;雷宇 | 申请(专利权)人: | 北京儒博科技有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/18;G10L15/26;G10L21/0208 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 张新利 |
地址: | 101500 北京市密云区经济开发*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 引擎 自动 切换 方法 装置 | ||
一种语音识别引擎自动切换方法和装置,该方法包括:采集用户输入的第一音频信号,并对第一音频信号进行处理;对处理后的第一音频信号进行语音识别,得到对应的语音文本;对语音文本进行语义分析,确定用户对应的语种倾向;根据语种倾向进行语音识别引擎切换,以对后续的第二音频信号进行语音识别。该方法能够根据用户的语种倾向实现各语音识别引擎之间的自动切换。
技术领域
本公开涉及语音识别领域,特别涉及一种语音识别引擎自动切换方法和装置。
背景技术
语音识别是实现人工智能的基础,很多机器人、物联网、移动智能终端都采用语音作为交互入口。语音识别引擎采集客户端的音频信号,然后将其送至语音识别引擎进行音频信号的识别和分析,最后将音频信号转换成文文信息,实现语音识别的目的。目前大多数语音识别系统采用单引擎工作模式,即工作时只能识别一种语言,例如科大讯飞的灵犀只能识别中文,如果用户对灵犀说英文,则无法被正确识别。这导致语音识别系统仅适用于单语种的语言环境。
发明内容
本发明的目的是提供一种语音识别引擎自动切换方法,该方法能够克服现有语音识别系统只能实现一种语言识别的缺陷。
相应的,本发明实施例还提供一种语音识别引擎自动切换装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种语音识别引擎自动切换方法,包括:
采集用户输入的第一音频信号,并对所述第一音频信号进行处理;
对处理后的第一音频信号进行语音识别,得到对应的语音文本;
对所述语音文本进行语义分析,确定用户对应的语种倾向;
根据所述语种倾向进行语音识别引擎切换,以对后续的第二音频信号进行语音识别。
优选地,对所述第一音频信号进行处理包括对所述第一音频信号进行降噪和消回声处理。
优选地,所述第一音频信号包括多路音频信号,对所述音频信号进行处理包括:
对所述多路音频信号分别进行比较,选择强度最大的一路音频信号进行降噪和消回声处理。
优选地,所述对所述语音文本进行语义分析时,
对所述语音文本进行句法分析,标注所述语音文本中的语法成分;
将所述语法成分与意图库进行匹配,从而确定当前用户对应的语种倾向,所述意图库用于输出采用对应语种的概率。
优选地,所述意图库包括分别与不同应用场景对应的多个意图库,每个意图库分别用于输出所在应用场景下采用对应语种的概率。
优选地,所述语音识别引擎自动切换方法还包括:
将所述语法成分与意图库进行匹配,从而确定当前用户对应的应用场景,所述意图库用于输出与所述应用场景关联的概率。
本发明另一方面提供一种语音识别引擎自动切换装置,包括:
音频信号采集处理模块,用于采集用户输入的第一音频信号,并对所述第一音频信号进行处理;
语音识别模块,用于对处理后的第一音频信号进行语音识别,得到对应的语音文本;
语义分析模块,用于对所述语音文本进行语义分析,确定用户对应的语种倾向;
切换模块,用于根据所述语种倾向进行语音识别引擎切换,以对后续的第二音频信号进行语音识别。
优选地,对所述第一音频信号进行处理包括对所述第一音频信号进行降噪和消回声处理。
优选地,所述第一音频信号包括多路音频信号,对所述音频信号进行处理包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京儒博科技有限公司,未经北京儒博科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611226504.0/2.html,转载请声明来源钻瓜专利网。