[发明专利]语音识别方法和装置、计算机可读存储介质、电子设备在审
申请号: | 202110351353.6 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113096642A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 黄明运 | 申请(专利权)人: | 南京地平线机器人技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22;G10L19/04;G10L25/30 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 王晓多 |
地址: | 210046 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开实施例公开了一种语音识别方法和装置、计算机可读存储介质、电子设备,其中,方法包括:将在应用场景中获取到的语音信号处理为多组语音特征;通过一个预测库分别对所述多组语音特征进行处理,得到多个预测结果;基于所述多个预测结果,确定所述应用场景中的语音识别结果;本实施例通过使用一个预测库对多组语音特征进行预测,降低了内存的占用空间,使本实施例提供方法可以应用在内存较小的系统上,提高语音识别方法的适用范围。
技术领域
本公开涉及语音识别技术领域,尤其是一种语音识别方法和装置、计算机可读存储介质、电子设备。
背景技术
在关键词唤醒的场景中,由于不同场景下降噪效果侧重点不同,为了达到较好的识别效果,经常会开启多路解码器来进行解码,因此增加了系统的内存占用。而在系统资源有限的平台上,内存是比较有限的资源,因此无法实现解码。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种语音识别方法和装置、计算机可读存储介质、电子设备。
根据本公开实施例的一个方面,提供了一种语音识别方法,包括:
将在应用场景中获取到的语音信号处理为多组语音特征;
通过一个预测库分别对所述多组语音特征进行处理,得到多个预测结果;
基于所述多个预测结果,确定所述应用场景中的语音识别结果。
根据本公开实施例的另一方面,提供了一种语音识别装置,包括:
信号处理模块,用于将在应用场景中获取到的语音信号处理为多组语音特征;
特征预测模块,用于通过一个预测库分别对所述信号处理模块得到的多组语音特征进行处理,得到多个预测结果;
语音识别模块,用于基于所述特征预测模块得到的多个预测结果,确定所述应用场景中的语音识别结果。
根据本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述实施例所述的语音识别方法。
根据本公开实施例的还一方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述实施例所述的语音识别方法。
基于本公开上述实施例提供的一种语音识别方法和装置、计算机可读存储介质、电子设备,将在应用场景中获取到的语音信号处理为多组语音特征;通过一个预测库分别对所述多组语音特征进行处理,得到多个预测结果;基于所述多个预测结果,确定所述应用场景中的语音识别结果;本实施例通过使用一个预测库对多组语音特征进行预测,降低了内存的占用空间,使本实施例提供方法可以应用在内存较小的系统上,提高语音识别方法的适用范围。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开一示例性实施例提供的语音识别系统的结构示意图。
图2是本公开一示例性实施例提供的语音识别方法的流程示意图。
图3是本公开另一示例性实施例提供的语音识别方法的流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京地平线机器人技术有限公司,未经南京地平线机器人技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110351353.6/2.html,转载请声明来源钻瓜专利网。