[发明专利]一种音频处理方法、装置、电子设备及存储介质有效
申请号: | 201911402690.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111145765B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王运侠 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G06N3/04;G06N3/08 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 215024 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种音频处理方法、装置、电子设备及存储介质,其中,所述方法包括:对实时输入的音频信息进行切分,得到至少一个音频段;对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,将所述每一个音频段的输出进行合并得到输出结果;其中,对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,包括:将所述每一个音频段的序列开始、序列中间以及序列结束分别进行神经网络计算,得到所述每一个音频段所对应的第一结果、第二结果以及第三结果;将每一个音频段所对应的所述第一结果、第二结果、第三结果合并,得到所述每一个音频段所对应的输出。
技术领域
本申请涉及信息处理领域,尤其涉及一种音频处理方法、装置、电子设备及存储介质。
背景技术
在相关技术中,进行音频信息处理,通常采用深度学习的方式,所述深度学习的方式中最常用的神经网络包括DNN(深度神经网络)、CNN(卷积神经网络)、RNN(循环神经网络)、DFSMN等等。其中,RNN循环神经网络中的长期信息,需在进入当前处理单元前顺序遍历所有单元。LSTM可以绕过单元从而记住更长的时间步骤,因此,LSTM可以消除一些梯度消失的问题。可以处理时间间隔和延迟较长的序列问题。LSTM和GRU是单向的,只依赖序列中当前时刻之前的输出状态,BLSTM是双向的,不仅依赖当前时刻之前的输出状态还依赖后面时刻的输出状态。DFSMN是一种新型的网络结构,它可以取得相比于目前最流行的基于长短时记忆单元的双向循环神经网络(BLSTM)的识别系统显著的性能提升。而且DFSMN在训练速度,模型参数量,解码速度及模型的推理延时上相比于BLSTM都具有明显的优势。
然而上述相关技术中的处理方式中,尤其是DFSMN、BLSMN这些双向结构的网络,由于训练较慢,模型参数量大,解码速度受到硬件设备制约,且计算量大导致的推理延时等问题,使得这类网络对其应用场景有很大的限制,无法提供在线语音实时处理。
发明内容
本申请提供一种音频处理方法、装置、电子设备及存储介质,以解决现有技术中存在的上述问题。
本发明一方面提供一种音频处理方法,所述方法包括:
对实时输入的音频信息进行切分,得到至少一个音频段;
对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,将所述每一个音频段的输出进行合并得到输出结果;
其中,对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,包括:
将所述每一个音频段的序列开始、序列中间以及序列结束分别进行神经网络计算,得到所述每一个音频段所对应的第一结果、第二结果以及第三结果;
将每一个音频段所对应的所述第一结果、第二结果、第三结果合并,得到所述每一个音频段所对应的输出。
本发明一方面提供一种音频处理装置,所述装置包括:
音频划分单元,用于对实时输入的音频信息进行切分,得到至少一个音频段;
音频处理单元,用于对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,将所述每一个音频段的输出进行合并得到输出结果;
其中,所述音频处理单元,具体用于将所述每一个音频段的序列开始、序列中间以及序列结束分别进行神经网络计算,得到所述每一个音频段所对应的第一结果、第二结果以及第三结果;将每一个音频段所对应的所述第一结果、第二结果、第三结果合并,得到所述每一个音频段所对应的输出。
本发明另一方面提供一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911402690.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种参数化的几何椭圆精确拟合方法
- 下一篇:HTTP报文处理方法及装置