[发明专利]语音识别的方法及装置、设备有效
| 申请号: | 201710831319.2 | 申请日: | 2017-09-15 |
| 公开(公告)号: | CN109523991B | 公开(公告)日: | 2023-08-18 |
| 发明(设计)人: | 高杰;李威;朱林 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/30;G10L15/32 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 孙敬霞;栗若木 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 设备 | ||
1.一种语音识别的方法,包括:
接收来自用户的语音;
获取热词语言模型,所述热词语言模型为根据用户提供的热词编译得到的语言模型;所述获取热词语言模型包括:根据用户提供的热词和权重信息得到热词词表;在所述热词词表发生更改时,根据所述热词词表编译热词语言模型;在所述热词词表没有更改时,查找之前编译过的对应所述热词词表的热词语言模型;
利用主语言模型查分,同时利用热词语言模型进行查分,将所述查分的结果叠加得到每个词的得分,并根据每个词的得分得到识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述获取热词语言模型之前,还包括:向用户提供权重档位信息,所述权重档位信息与预先设定的权重得分相对应;
所述获取热词语言模型,包括:接收所述用户提供的热词以及选择的权重档位信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述热词词表编译热词语言模型,包括:
根据所述热词词表中各热词及其权重信息进行分词,得到分词词表;
利用所述分词词表构建带权重的前缀树;
利用所述带权重的前缀树构建加权有限状态接收器WFSA,并得到基于所述WFSA的热词语言模型。
4.根据权利要求3所述的方法,其特征在于,所述利用所述带权重的前缀树构建WFSA之前,还包括:调整所述前缀树上各弧的权重,使得所述前缀树上路径的权重得分与该路径所对应的热词权重得分一致。
5.根据权利要求3或4所述的方法,其特征在于,所述利用所述带权重的前缀树构建WFSA之前,还包括:采用最长后缀匹配在所述前缀树上添加跳转弧,并调整所述跳转弧上的权重使得根节点到相应跳转节点的路径的权重得分相同。
6.根据权利要求1所述的方法,其特征在于,所述主语言模型为N-gram语言模型。
7.一种语音识别装置,包括:
接收模块,用于接收来自用户的语音;
获取模块,用于获取热词语言模型,所述热词语言模型为根据用户提供的热词编译得到的语言模型,所述获取热词语言模型包括:根据用户提供的热词和权重信息得到热词词表;在所述热词词表发生更改时,根据所述热词词表编译热词语言模型;在所述热词词表没有更改时,查找之前编译过的对应所述热词词表的热词语言模型;
解码模块,用于利用主语言模型查分,同时利用热词语言模型进行查分,将所述查分的结果叠加得到每个词的得分,并根据每个词的得分得到识别结果。
8.一种语音识别设备,包括:
存储有语音识别程序存储器;
处理器,配置为读取所述语音识别程序以执行下述操作:
接收来自用户的语音;
获取热词语言模型,所述热词语言模型为根据用户提供的热词编译得到的语言模型,所述获取热词语言模型包括:根据用户提供的热词和权重信息得到热词词表;在所述热词词表发生更改时,根据所述热词词表编译热词语言模型;在所述热词词表没有更改时,查找之前编译过的对应所述热词词表的热词语言模型;
利用主语言模型查分,同时利用热词语言模型进行查分,将所述查分的结果叠加得到每个词的得分,并根据每个词的得分得到识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710831319.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音检测方法和装置
- 下一篇:藏语方言语音处理系统





