[发明专利]一种语音识别的方法及系统在审
申请号: | 201610065010.2 | 申请日: | 2016-01-30 |
公开(公告)号: | CN105719650A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 谷树森 | 申请(专利权)人: | 深圳市尔木科技有限责任公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/26 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 石伍军;张鹏 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 系统 | ||
技术领域
本发明涉及语音识别领域,特别涉及一种语音识别的方法及系统。
背景技术
语音识别技术就是让机器通过识别和理解过程将语音信号转变为相应的文字或命令的技术。目前现有的语音识别系统包括听写识别和命令词识别,而这两种技术都存在缺陷。听写识别的不足在于对计算机硬件以及通信网络要求相对较高,响应时间比较长;命令词识别虽然不需要网络但是其识别内容受到限制,无法满足需要大量内容识别的需求,因此,在目前的智能硬件上还无法大规模应用语音识别。
发明内容
为了克服现有技术语音识别系统不能大规模应用智能硬件的不足,本发明的目的在于提供一种便于语音识别系统大规模应用的语音识别的方法及系统。
为解决上述问题,本发明所采用的技术方案如下:提供一种语音识别的方法,包括以下步骤:
S101:获取语音数据;
S102:通过命令词识别模块识别所述语音数据,若所述命令词识别模块识别出所述语音数据,则输出所述命令词识别模块识别的语音数据结果;若否,则输入至听写识别模块;
S103:通过听写识别模块识别所述输入至听写识别模块的语音数据,并获得最终的语音数据结果。
优选地,步骤S102包括以下步骤:
根据命令词构建波纹库;
将获取的语音数据的波纹与波纹库内的波纹进行比对,若有,则输出命令词识别模块识别的语音数据结果;若无,则输入至听写识别模块。
优选地,步骤S103包括以下步骤:
从所述输入至听写识别模块的语音数据中提取特征信息;
利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。
优选地,所述特征信息为MFCC或PLP。
提供一种语音识别的系统,其特征在于,包括获取模块、命令词识别模块以及听写识别模块,所述命令词识别模块连接所述获取模块,所述听写识别模块连接所述命令词识别模块;其中,
所述获取模块用于获取语音数据;
所述命令词识别模块用于识别所述语音数据,若所述命令词识别模块识别出所述语音数据,则输出所述命令词识别模块识别的语音数据结果;若否,则输入至所述听写识别模块;
所述听写识别模块用于识别所述命令词识别模块输入的语音数据,并获得最终的语音数据结果。
优选地,所述命令词识别模块包括构建模块和比对模块,所述构建模块用于根据命令词构建波纹库,所述比对模块用于将获取的语音数据的波纹与波纹库内的波纹进行比对,若有,则输出所述命令词识别模块识别的语音数据结果;若否,则输入至听写识别模块。
优选地,所述听写识别模块包括提取模块和模型模块,所述提取模块用于从所述输入至听写识别模块的语音数据中提取特征信息,所述模型模块用于利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。
优选地,所述听写识别模块为HTK语音识别模块。
相比现有技术,本发明的有益效果在于:
该一种语音识别的方法及系统通过在语音输入后首先进行命令词识别,如果命令词识别出识别结果则识别完成,如果未识别出识别结果则进行听写识别,最后给出识别结果,使得语音识别技术能够在不需要过高的硬件配置不需要对网络依赖不受识别内容限制的情况下,仍能够拥有较高的识别精度,同时,在一定程度上还扩大了语音识别系统在智能硬件上应用规模。
附图说明
图1是本发明实施例一种语音识别的方法的流程图;
图2是本发明实施例一种语音识别的系统的模块结构图。
图中标识说明:
1001、获取模块;1002、命令词识别模块;1003、听写识别模块。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细说明。
请参阅图1,图1示出了本发明提供的实施例一种语音识别方法的流程图,该语音识别的方法包括以下步骤:
S101:获取语音数据;
S102:通过命令词识别模块识别所述语音数据,若所述命令词识别模块识别出所述语音数据,则输出所述命令词识别模块识别的语音数据结果;若否,则输入至听写识别模块;
具体地,步骤S102包括以下步骤:
根据命令词构建波纹库;
将获取的语音数据的波纹与波纹库内的波纹进行比对,若有,则输出命令词识别模块识别的语音数据结果;若无,则输入至听写识别模块。
S103:通过听写识别模块识别所述输入至听写识别模块的语音数据,并获得最终的语音数据结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市尔木科技有限责任公司,未经深圳市尔木科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610065010.2/2.html,转载请声明来源钻瓜专利网。