首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种语音识别方法、装置和计算机可读存储介质有效

申请号：	201810600422.0	申请日：	2018-06-12
公开（公告）号：	CN110600011B	公开（公告）日：	2022-04-01
发明（设计）人：	高莹莹	申请（专利权）人：	中国移动通信有限公司研究院;中国移动通信集团有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/08;G10L15/10
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	王姗姗;张颖玲
地址：	100053 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种语音识别方法、装置和计算机可读存储介质，所述方法包括：统计识别结果中每个词语发生每种类型识别错误的次数；基于所述每个词语发生每种类型识别错误的次数，确定该词语以及该词语构成的N元词组的语言模型加权因子；基于所述语言模型加权因子，分别对该词语的语言模型概率以及该词语构成的N元词组的语言模型概率进行调整，基于调整后的语言模型再次进行语音识别；所述N为大于1的正整数。

技术领域

本发明涉及移动通信技术领域，尤其涉及一种语音识别方法、装置和计算机可读存储介质。

背景技术

语音识别的最终目标是把输入的语音序列转换为正确的汉字序列。在大词汇量连续语音识别中，由于各种因素的影响，解码输出的识别假设中经常存在错误，阻碍了语音识别系统的应用。

对于识别结果的纠错方法通常是基于某些转换规则的，如在某些条件下将某些词语修正为其他词语，这类方法的难点在于如何提取或学习到有效并且鲁棒的转换规则，而不会在修正某些词语的同时又引入了新的错误。

相关技术中提出了提高语音识别准确性的方法，但是也存在一定的局限性：

1)应用过程需要积累一定量的用户语料并提供用户文档，在当前很多应用中不具备该条件；

2)按类别对加权因子进行调整的方式相对较粗，不能更有针对性的调整某些易错易混词；

3)未给出对于词组语言模型概率调整的方法。

发明内容

有鉴于此，本发明实施例期望提供一种语音识别方法、装置和计算机可读存储介质。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种语音识别方法，该方法包括：

统计识别结果中每个词语发生每种类型识别错误的次数；

基于所述每个词语发生每种类型识别错误的次数，确定该词语以及该词语构成的N元词组的语言模型加权因子；

基于所述语言模型加权因子，分别对该词语的语言模型概率以及该词语构成的N元词组的语言模型概率进行调整，基于调整后的语言模型再次进行语音识别；所述N为大于1的正整数。

其中，所述识别错误的类型包括：

替代型错误、删除型错误和插入型错误。

其中，所述统计识别结果中每个词语发生每种类型识别错误的次数，包括：

确定发生删除型错误，则在标注文本中该错误位置对应词语的删除型错误次数D加1；在标注文本中与该词语构成的N元词组的D也加1；

确定发生插入型错误，则在识别文本中该错误位置对应词语的插入型错误次数I加1；在识别文本中与该词语构成的N元词组的I也加1；

确定发生替代型错误，则在标注文本中该错误位置对应词语的被其他词语替代次数S_pas加1，在标注文本中与该词语构成的N元词组的S_pas也加1；在识别文本中该错误位置对应词语替代目标词语的次数S_act加1，在识别文本中与该词语构成的N元词组的S_act也加1。

其中，所述语言模型加权因子表示为：

R＝(S_pas+D)/(S_act+I)；

其中，所述R表示语言模型加权因子，所述D表示在识别结果中出现删除型错误的次数，所述I表示插入型错误的次数，所述S_act表示替代目标词语的次数，所述S_pas表示被其他词语替代的次数。

其中，所述基于所述语言模型加权因子，分别对该词语的语言模型概率以及该词语构成的N元词组的语言模型概率进行调整，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司，未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810600422.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种语料提取方法及装置
下一篇：一种人工智能学习的模糊语音语义识别方法及系统

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top