[发明专利]一种语音识别方法及装置在审
申请号: | 202210540451.9 | 申请日: | 2022-05-17 |
公开(公告)号: | CN115188382A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 韩阳;李先刚;邹伟;王健;常超;倪超 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/34 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取多条待识别的输入语音;
将各条所述输入语音同时输入运行在图形处理器上的语音识别模型,得到所述语音识别模型同时输出的对应各条所述输入语音的文本识别结果;
其中,所述语音识别模型是基于样本语音、所述样本语音对应的文本训练得到的;
所述语音识别模型用于基于对输入语音编码成特征表示,根据特征表示以及输入语音的前一时刻的识别结果,对输入语音当前时刻进行识别得到当前时刻识别结果,直至识别结束,得到输入语音的文本识别结果。
2.根据权利要求1所述的语音识别方法,其特征在于,所述获取多条待识别的输入语音,之后还包括:
将各条待识别的所述输入语音的长度进行缓存;
根据缓存的各条输入语音的长度确定各条输入语音的结束符号的位置。
3.根据权利要求2所述的语音识别方法,其特征在于,所述根据缓存的各条输入语音的长度确定各条输入语音的结束符号的位置,之后还包括:将各条待识别的所述输入语音处理为长度一致的语音,使得各条所述输入语音形成输入矩阵。
4.根据权利要求3所述的语音识别方法,其特征在于,所述将各条待识别的所述输入语音处理为长度一致的语音,使得各条所述输入语音形成输入矩阵,具体包括:
在各条所述输入语音中以长度最长的语音为基准,将其他输入语音通过补充占位符的方式处理为与基准的语音长度一致的语音,使得语音长度相同的各条输入语音形成输入矩阵。
5.根据权利要求4所述的语音识别方法,其特征在于,所述语音识别模型包括编码器及解码器;
所述将各条所述输入语音同时输入运行在图形处理器上的语音识别模型,得到所述语音识别模型同时输出的对应各条所述输入语音的文本识别结果,具体包括:
通过编码器将各条所述输入语音编码为特征表示集合;
对所述特征表示集合进行缓存;
根据缓存的特征表示集合通过解码器对各条输入语音同时进行解码处理,得到并同时输出各条输入语音的文本识别结果。
6.根据权利要求5所述的语音识别方法,其特征在于,所述输入语音包括语音特征;所述根据缓存的特征表示集合通过解码器对各条输入语音进行解码处理,得到各条输入语音的文本识别结果,具体包括:
将缓存的特征表示集合以及解码器输出的输入语音前一时刻的语音特征的识别结果同时输入解码器,得到解码器输出的输入语音当前时刻的语音特征的识别结果;
将输入语音当前时刻的语音特征的识别结果进行缓存,以将其作为解码器对输入语音下一时刻的语音特征进行识别时的一项输入;
通过解码器继续对输入语音当前时刻之后的各时刻的语音特征依次进行识别,响应于识别到输入语音的结束符号,得到输入语音的文本识别结果。
7.根据权利要求6所述的语音识别方法,其特征在于,所述响应于识别到输入语音的结束符号,得到输入语音的文本识别结果,具体包括:
根据输入语音解码中各时刻产生的识别结果,使得输入语音产生多条候选路径,其中一条所述候选路径表征一种文本识别结果;
根据输入语音的结束符号得到各条候选路径的候选结果;
根据各个候选结果分别确定对应的候选路径长度;
根据各条候选路径的路径长度确定路径总长;
以路径总长为分母,候选路径长度为分子,得到各条候选路径的平均值;
将所述平均值数值最大的候选路径的候选结果作为输入语音的文本识别结果。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音识别方法的步骤。
9.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至7任一项所述语音识别方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210540451.9/1.html,转载请声明来源钻瓜专利网。