[发明专利]语音识别方法、装置、电子设备及计算机可读介质有效
| 申请号: | 202210891670.1 | 申请日: | 2022-07-27 |
| 公开(公告)号: | CN115064173B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 白烨;王晓瑞 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/30 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种语音识别方法,其特征在于,包括:
获取待识别的语音特征序列,将所述语音特征序列输入语音识别系统中;
通过所述语音识别系统中的编码器得到所述语音特征序列对应的语义特征向量序列,其中,所述语音识别系统的编码器中包含多组混合专家网络模块,所述混合专家网络模块中包括前馈神经网络、自注意力网络、卷积网络、混合专家网络以及归一化层,所述混合专家网络中包括路由网络,各组所述混合专家网络模块串行连接,不同组的所述混合专家网络模块中,除所述归一化层以及所述路由网络之外的其他网络中的神经网络参数的权重共享;
通过所述语音识别系统中的解码器对所述语义特征向量序列进行解码处理,得到所述语音特征序列对应的文本序列。
2.根据权利要求1所述的语音识别方法,其特征在于,所述通过所述语音识别系统中的编码器得到所述语音特征序列对应的语义特征向量序列,包括:
将所述语音特征序列输入所述语音识别系统的编码器中的第一组所述混合专家网络模块中;
依次将上一组所述混合专家网络模块的输出特征序列输入至当前所述混合专家网络模块,得到当前所述混合专家网络模块的输出特征序列;
根据最后一组所述混合专家网络模块的输出特征序列得到所述语音特征序列对应的语义特征向量序列。
3.根据权利要求2所述的语音识别方法,其特征在于,所述依次将上一组所述混合专家网络模块的输出特征序列输入至当前所述混合专家网络模块,得到当前所述混合专家网络模块的输出特征序列,包括:
将上一组所述混合专家网络模块的输出特征序列输入至当前所述混合专家网络模块的前馈神经网络中,得到所述前馈神经网络的输出特征序列;
将所述前馈神经网络的输出特征序列输入至所述自注意力网络,得到所述自注意力网络的输出特征序列;
将所述自注意力网络的输出特征序列输入至所述卷积网络,得到所述卷积网络的输出特征序列;
将所述卷积网络的输出特征序列输入至所述混合专家网络,得到所述混合专家网络的输出特征序列;
将所述混合专家网络的输出特征序列在所述归一化层进行归一化处理,得到当前所述混合专家网络模块的输出特征序列。
4.根据权利要求3所述的语音识别方法,其特征在于,所述混合专家网络中包括多个并行的前馈神经网络和路由网络,所述将所述卷积网络的输出特征序列输入至所述混合专家网络,得到所述混合专家网络的输出特征序列,包括:
通过所述混合专家网络中的路由网络以及所述混合专家网络的输入特征序列,从所述混合专家网络中的多个前馈神经网络中确定出目标前馈神经网络;
将所述卷积网络的输出特征序列输入至所述混合专家网络中的目标前馈神经网络,得到所述目标前馈神经网络的输出特征序列;
通过所述路由网络得到所述目标前馈神经网络对应的目标激活值,根据所述目标前馈神经网络的输出特征序列和所述目标激活值得到所述混合专家网络的输出特征序列。
5.根据权利要求4所述的语音识别方法,其特征在于,所述通过所述混合专家网络中的路由网络以及所述混合专家网络的输入特征序列,从所述混合专家网络中的多个前馈神经网络中确定出目标前馈神经网络,包括:
将所述混合专家网络的输入特征序列输入所述混合专家网络中的路由网络,通过所述路由网络得到所述混合专家网络中的各个所述前馈神经网络对应的激活值;
根据各个所述前馈神经网络对应的激活值确定出所述目标前馈神经网络。
6.根据权利要求1至5任意一项所述的语音识别方法,其特征在于,所述通过所述语音识别系统中的解码器对所述语义特征向量序列进行解码处理,得到所述语音特征序列对应的文本序列,包括:
将所述语义特征向量序列以及当前文本字符对应的文本前缀输入所述语音识别系统的解码器中,得到各个候选文本字符的概率估计值;
根据所述概率估计值,从所述候选文本字符中确定下一文本字符;
根据各个文本字符得到所述语音特征序列对应的文本序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210891670.1/1.html,转载请声明来源钻瓜专利网。





