[发明专利]语音识别系统和用于语音识别的方法有效
申请号: | 201780090477.5 | 申请日: | 2017-11-10 |
公开(公告)号: | CN110603583B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 堀贵明;渡部晋治;J·赫尔希 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/16 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘久亮;黄纶伟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 用于 方法 | ||
1.一种语音识别系统,该语音识别系统包括:
输入装置,该输入装置接收声音;
一个或更多个处理器;以及
一个或更多个储存装置,所述一个或更多个储存装置存储参数和程序模块,所述程序模块包含能够由所述一个或更多个处理器执行的指令,所述指令在被执行时使得所述一个或更多个处理器执行包括以下项的操作:
使用声学特征提取模块从由声音转换的音频波形数据中提取声学特征序列;
使用具有编码器网络参数的编码器网络将所述声学特征序列编码为隐藏向量序列;
通过将所述隐藏向量序列馈送到具有解码器网络参数的解码器网络来预测第一输出标签序列概率;
使用联结主义时间分类CTC网络参数和来自所述编码器网络的所述隐藏向量序列,由CTC模块来预测第二输出标签序列概率;以及
使用标签序列搜索模块,通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合,来搜索具有最高序列概率的输出标签序列。
2.根据权利要求1所述的语音识别系统,其中,所述解码器网络在预测所述第一输出标签序列概率之前从所述标签序列搜索模块接收先前标签。
3.根据权利要求1所述的语音识别系统,其中,所述CTC模块在预测所述第二输出标签序列概率之前从所述标签序列搜索模块接收先前标签。
4.根据权利要求1所述的语音识别系统,其中,所述编码器网络包括层叠的双向长短期记忆BLSTM。
5.根据权利要求1所述的语音识别系统,其中,所述解码器网络包括层叠的长短期记忆LSTM,并且使用针对所述隐藏向量序列的注意力机制来预测每个输出标签序列概率。
6.根据权利要求1所述的语音识别系统,其中,对数域中的线性组合用于将所述第一输出标签序列概率和所述第二输出标签序列概率组合。
7.根据权利要求1所述的语音识别系统,其中,搜索操作使用波束搜索,以找到具有所述最高序列概率的所述输出标签序列,所述最高序列概率通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合而获得。
8.根据权利要求7所述的语音识别系统,其中,所述波束搜索首先使用从所述解码器网络提供的所述第一标签序列概率找到完整标签序列假设集,然后从该完整标签序列假设集中找到具有所述最高序列概率的所述输出标签序列,所述最高序列概率通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合而获得。
9.根据权利要求7所述的语音识别系统,其中,所述波束搜索剪掉与其它不完整标签序列假设相比具有低序列概率的不完整标签序列假设,并且该序列概率是通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合而获得的。
10.根据权利要求1所述的语音识别系统,其中,所述CTC模块使用所述CTC网络参数和动态编程技术来计算后验概率分布,以预测所述第二输出标签序列概率。
11.一种语音识别方法,该语音识别方法包括以下步骤:
使用声学特征提取模块,从由输入装置接收的声音转换的音频波形数据中提取声学特征序列;
使用从一个或更多个储存装置获取编码器网络参数的编码器网络,将所述声学特征序列编码为隐藏向量序列;
通过将所述隐藏向量序列馈送到从所述一个或更多个储存装置获取解码器网络参数的解码器网络,来预测第一输出标签序列概率;
由联结主义时间分类CTC模块使用CTC网络参数和来自所述编码器网络的所述隐藏向量序列,来预测第二输出标签序列概率;以及
使用标签序列搜索模块,通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合,来搜索具有最高序列概率的输出标签序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780090477.5/1.html,转载请声明来源钻瓜专利网。