[发明专利]基于CRNN的语音识别方法、系统、存储介质及电子设备有效

专利信息
申请号: 201910177117.X 申请日: 2019-03-08
公开(公告)号: CN111667819B 公开(公告)日: 2023-09-01
发明(设计)人: 仇璐 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G10L15/16 分类号: G10L15/16;G10L15/26;G10L15/02
代理公司: 上海弼兴律师事务所 31283 代理人: 薛琦;罗朗
地址: 100086 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 crnn 语音 识别 方法 系统 存储 介质 电子设备
【说明书】:

发明公开了一种基于CRNN的语音识别方法、系统、存储介质及电子设备,其中,识别方法包括:获取处理语音数据,处理语音数据为滤波器组指向预处理后的语音数据的当前帧位置起的预设滤波宽度值范围内的语音数据;将处理语音数据输入至卷积层,卷积层输出得到一帧卷积输出帧数据;更新滤波器组的指向;判断滤波器组的预设特征长度的语音数据是否获取完毕,若为否,则返回获取处理语音数据的步骤,若为是,则将得到的所有帧数的卷积输出帧数据输入至RNN层,得到输出状态值;将输出状态值输入至全连接层得到语音识别的结果。本发明与传统的相比,处理的数据量大大减少,可以提高计算速度,减少内存占用空间,以实时地进行语音识别的目的。

技术领域

本发明涉及语音识别领域,尤其涉及一种基于CRNN(卷积循环神经网络)的语音识别方法、系统、存储介质及电子设备。

背景技术

随着计算机技术发展,人们应用的电子产品日益趋向智能化,语音作为人类的最常使用的交互方式,在端设备上使用智能语音识别以及语音唤醒技术也成为智能方向上的一个热点。深度学习算法相对传统语音识别算法具有较高的准确率,较强的可塑性和普适性等优点,成为了应用在语音识别及语音唤醒系统中的语音识别技术主流。而具有优秀识别率的CRNN就是常用的语音识别深度学习神经网络的一种。

CRNN包括卷积层、RNN(一种循环神经网络)层、全连接层,CRNN在进行语音识别时接收固定长度的预处理后的语音数据,依次经过卷积层、RNN层、全连接层输出识别结果,计算量很大。特别是在语音唤醒应用环境中,通常为了解决周围环境和传播媒介引入的来自四面八方的干扰(回声、混响、干扰声源),一般会采用麦克风阵列来捕捉、预处理语音数据,再传输到CRNN中进行预处理语音数据的语音识别,但因其计算量大,受端设备的计算能力以及麦克风分布波束个数限制,CRNN难以实时地进行语音识别计算,进而影响了语音唤醒的定位准确度和唤醒准确度。

发明内容

本发明要解决的技术问题是为了克服现有技术中CRNN在端设备进行语音信息处理时的计算量大,难以实时地进行语音识别的计算的缺陷,提供一种基于CRNN的语音识别方法、系统、存储介质及电子设备。

本发明是通过下述技术方案来解决上述技术问题:

本发明实施例提供了一种基于CRNN的语音识别方法,所述CRNN包括卷积层、RNN层、全连接层,所述卷积层包括滤波器组,其特征在于,所述语音识别方法包括:

获取处理语音数据,所述处理语音数据为所述滤波器组指向预处理后的语音数据的当前帧位置起的预设滤波宽度值范围内的语音数据;

将所述处理语音数据输入至所述卷积层,所述卷积层输出得到一帧卷积输出帧数据;

更新所述滤波器组的指向;

判断所述滤波器组的预设特征长度的语音数据是否获取完毕,若判断结果为否,则返回所述获取处理语音数据的步骤若所述判断结果为是,则将得到的所有帧数的卷积输出帧数据输入至所述RNN层,所述RNN层输出得到输出状态值;

将所述输出状态值输入至所述全连接层,所述全连接层输出得到所述预设特征长度的语音数据对应的语音识别的结果。

较佳地,所述将得到的所有帧数的卷积输出帧数据输入至所述RNN层,所述RNN层输出得到输出状态值的步骤包括:

将当前帧的所述卷积输出帧数据与前一次更新的所述RNN层的中间状态值输入至所述RNN层,所述RNN层输出得到更新后的中间状态值;

判断是否所有帧数的卷积输出帧数据输入完毕,若判断结果为否,则将下一帧的卷积输出帧数据作为当前帧的卷积输出帧数据,将所述更新后的中间状态值设置为前一次更新的所述RNN层的中间状态值,并返回所述将当前帧的所述卷积输出帧数据与前一次更新的所述RNN层的中间状态值输入至所述RNN层的步骤;若判断结果为是,则将所述RNN层最后一次的末层状态值作为输出状态值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910177117.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top