[发明专利]语音解码方法、装置、电子设备和存储介质有效

申请号：	202111255706.9	申请日：	2021-10-27
公开（公告）号：	CN114220444B	公开（公告）日：	2022-09-06
发明（设计）人：	李威;方昕;李永超	申请（专利权）人：	安徽讯飞寰语科技有限公司
主分类号：	G10L19/16	分类号：	G10L19/16;G10L15/28
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	程琛
地址：	230088 安徽省合肥市高***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音解码方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种语音解码方法、装置、电子设备和存储介质，其中方法包括：确定待解码语音；基于待解码语音中，上一语音帧的候选解码路径在语音解码模型中所处解码网络的解码情况，确定当前解码路径，语音解码模型包括多个解码网络；基于待解码语音中的当前语音帧，在当前解码路径所处解码网络中，对当前解码路径进行扩展，得到当前语音帧的候选解码路径，并将当前语音帧的下一语音帧更新为当前语音帧，直至当前语音帧为待解码语音的尾帧，利用上一语音帧的候选解码路径所处解码网络的解码情况选取路径，降低了最优解码路径被错误筛除的可能性，提高了解码的速度和精度，解决了传统的语音解码方案对内存的占用较多的问题，减少了非必要的内存占用。

技术领域

本发明涉及数据处理技术领域，尤其涉及一种语音解码方法、装置、电子设备和存储介质。

背景技术

在语音识别领域，主要的解码方案是通过加权有限状态转换器(Weighted FiniteState Transducer，WFST)解码网络进行解码，但是这一方案局限于特定的场景。

而为了克服WFST解码网络定制化场景的缺陷，通常在WFST解码网络的解码结果的基础上，加入了有限状态接收器(Finite State Acceptor，FSA)解码网络，由WFST解码网络和FSA解码网络分开解码，每一解码网络均输出一个解码结果，两者的解码结果进行博弈，确定分数高的解码结果，并将其作为最终的解码结果，但是该方案占用的内存较多，特别是针对本地的应用场景，例如车载语音识别系统，其对于内存的占用能够达到20MB-50MB，对本地识别来说，过多占用内存直接限制了语音解码方案的应用。

发明内容

本发明提供一种语音解码方法、装置、电子设备和存储介质，用以解决现有技术中语音解码方案对于内存占用较多的缺陷。

本发明提供一种语音解码方法，包括：

确定待解码语音；

基于所述待解码语音中，上一语音帧的候选解码路径在语音解码模型中所处解码网络的解码情况，确定当前解码路径，所述语音解码模型包括多个解码网络；

基于所述待解码语音中的当前语音帧，在所述当前解码路径所处解码网络中，对所述当前解码路径进行扩展，得到所述当前语音帧的候选解码路径，并将所述当前语音帧的下一语音帧更新为当前语音帧，直至所述当前语音帧为所述待解码语音的尾帧。

根据本发明提供的一种语音解码方法，所述基于所述待解码语音中，上一语音帧的候选解码路径在语音解码模型中所处解码网络的解码情况，确定当前解码路径，包括：

基于所述上一语音帧的候选解码路径所处解码网络的解码情况，确定所述语音解码模型中各解码网络的当前路径数量阈值；

基于各解码网络的当前路径数量阈值，从各解码网络针对上一语音帧解码得到的第一路径中选取当前解码路径，所述候选解码路径基于所述第一路径确定。

根据本发明提供的一种语音解码方法，所述基于所述上一语音帧的候选解码路径所处解码网络的解码情况，确定所述语音解码模型中各解码网络的当前路径数量阈值，包括：

基于所述上一语音帧在语音解码模型中各解码网络分别得到的候选解码路径的数量和/或解码质量，确定所述语音解码模型中各解码网络的当前路径数量阈值。

根据本发明提供的一种语音解码方法，所述基于所述上一语音帧在语音解码模型中各解码网络分别得到的候选解码路径的数量，确定所述语音解码模型中各解码网络的当前路径数量阈值，包括：