[发明专利]实时语音识别方法及系统有效
申请号: | 202011207353.0 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112259082B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 蒋子缘 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 语音 识别 方法 系统 | ||
1.一种实时语音识别方法,包括:
在令牌传递过程中,确定采集到的实时语音中的从第一帧到第N帧的每一帧的至少一个令牌,其中,所述令牌传递时起始的令牌为起始令牌;
基于所述每一帧的各个令牌的状态概率,确定当前最佳识别结果的路径,所述当前最佳识别结果的路径由第一帧到第N帧的至少N个令牌连接构成;
选择所述当前最佳识别结果的路径中第i帧中与第i+1帧有直接连接关系的令牌作为截断令牌,从所述起始令牌到第i帧的所述截断令牌构成的历史令牌组中提取由多条识别结果的路径构成的网格;
从所述网格提取出从第一帧到第i帧的最佳识别结果的路径。
2.根据权利要求1所述的方法,其中,所述i与所述第一帧到第N帧的中间帧的帧数相关。
3.根据权利要求1所述的方法,其中,在从所述网格提取出从第一帧到第i帧的最佳识别结果的路径之后,所述方法还包括:
基于已确定的从第一帧到第i帧的最佳识别结果的路径,对第i+1帧到第N帧中的每一帧的令牌进行裁剪。
4.根据权利要求3所述的方法,其中,所述裁剪包括:
更新从第i+1帧开始到第N帧中的每一帧的每个令牌的概率;和/或
去除历史令牌组中不包含所述截断令牌的路径。
5.根据权利要求3所述的方法,其中,所述裁剪是逐帧进行。
6.根据权利要求1所述的方法,其中,在所述令牌传递过程中,确定采集到的实时语音中的每一帧的至少一个令牌为经过裁剪后的令牌。
7.一种实时语音识别系统,包括:
令牌确定程序模块,用于在令牌传递过程中,确定采集到的实时语音中的从第一帧到第N帧的每一帧的至少一个令牌,其中,所述令牌传递时起始的令牌为起始令牌;
最佳路径确定程序模块,用于基于所述每一帧的各个令牌的状态概率,确定当前最佳识别结果的路径,所述当前最佳识别结果的路径由第一帧到第N帧的至少N个令牌连接构成;
截断程序模块,用于选择所述当前最佳识别结果的路径中第i帧中与第i+1帧有直接连接关系的令牌作为截断令牌,从所述起始令牌到第i帧的所述截断令牌构成的历史令牌组中提取由多条识别结果的路径构成的网格;
识别程序模块,用于从所述网格提取出从第一帧到第i帧的最佳识别结果的路径。
8.根据权利要求7所述的系统,其中,所述系统还用于:
基于已确定的从第一帧到第i帧的最佳识别结果的路径,对第i+1帧到第N帧中的每一帧的令牌进行裁剪。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011207353.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于SPGD算法的相干FSOC系统
- 下一篇:自主避障规划方法和装置