[发明专利]语音识别方法及装置有效
申请号: | 201610875665.6 | 申请日: | 2016-09-30 |
公开(公告)号: | CN106653013B | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 陈鲁 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L15/08 |
代理公司: | 11391 北京智汇东方知识产权代理事务所(普通合伙) | 代理人: | 康正德;孙晓芳 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
本发明提供了一种语音识别方法及装置。所述方法包括:接收语音数据;判断所述语音数据是否属于用于触发所述客户端的特定功能的命令词类,所述命令词类包括由词或词的组合构成的多个命令词;当所述语音数据属于所述命令词类时,在所述命令词类中确定出与所述语音数据对应的命令词,并触发所述命令词对应的特定功能;当所述语音数据不属于所述命令词类时,将包含所述语音数据的操作指令上传至网络侧,由所述网络侧识别出所述语音数据对应的文字内容,并根据所述操作指令执行相应操作。该技术方案能够避免用户连续输入不同类型的语音数据时需在不同语音识别方式间来回切换的情况,极大地提升了用户对客户端语音识别功能的使用体验。
技术领域
本发明涉及语音处理技术领域,特别是涉及一种语音识别方法及装置。
背景技术
语音识别通常支持命令词匹配和在线语音识别两种模式。其中,命令词匹配指用户预先定义几个词作为命令词,当终端接收到用户输入的语音数据时,从预先定义的多个命令词中匹配出与该语音数据对应的词。可以看出,命令词匹配仅能匹配出预先定义的几个命令词,其主要用于唤醒、触发终端上的特定功能。而在线语音识别则是由终端将接收到的语音数据上传至网络侧,利用网络侧的声音模型对语音数据进行识别。因此,在线语音识别可识别出任意的词,识别结果可用于终端执行搜索、书写、人机对话等操作。
现有的语音助手类软件或者含有语音输入功能的软件中,都只单方面支持上述两种模式中的一种模式,而不支持另一种模式。即将命令词匹配和在线语音识别分开使用。用户在使用这类软件输入语音数据时,要么切换到命令词场景中,要么切换到在线语音听写场景中。例如,用户想要通过语音输入功能触发终端上的某一特定功能,则需首先将终端的语音识别模式切换到命令词场景中;当成功触发该特定功能后,假如用户又想通过语音输入的方式向好友打电话,则需将终端的语音识别模式从命令词场景中切换到语音拨号场景(即在线语音识别场景)中。显然,上述语音识别方式需要用户来回在不同场景间切换,操作起来十分麻烦,极大地降低了用户使用语音识别功能的体验度。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的语音识别方法及装置。
依据本发明的一个方面,提供了一种语音识别方法,应用于客户端,所述方法包括:
接收语音数据;
判断所述语音数据是否属于用于触发所述客户端的特定功能的命令词类,所述命令词类包括由词或词的组合构成的多个命令词;
当所述语音数据属于所述命令词类时,在所述命令词类中确定出与所述语音数据对应的命令词,并触发所述命令词对应的特定功能;
当所述语音数据不属于所述命令词类时,将包含所述语音数据的操作指令上传至网络侧,由所述网络侧识别出所述语音数据对应的文字内容,并根据所述操作指令执行相应操作。
可选地,判断所述语音数据是否属于用于触发所述客户端的特定功能的命令词类,包括:
获取所述客户端预设的命令词类;
将所述语音数据与所述命令词类进行匹配,以判断出所述命令词类中是否包含与所述语音数据相匹配的命令词;
当所述命令词类中包含与所述语音数据相匹配的命令词时,确定所述语音数据属于所述命令词类。
可选地,将所述语音数据与所述命令词类进行匹配,以判断出所述命令词类中是否包含与所述语音数据相匹配的命令词,包括:
利用所述客户端预存的语言模型确定所述语音数据对应的语言文字;
计算所述语言文字与所述命令词类中的各命令词之间相匹配的置信度;
当置信度最高值大于或等于预设阈值时,确定所述命令词类中包含与所述语音数据相匹配的命令词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610875665.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于WIFI及语音控制的智能马桶
- 下一篇:扩声系统