[发明专利]语音识别方法和系统有效
申请号: | 201110440273.4 | 申请日: | 2011-12-26 |
公开(公告)号: | CN103177721A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 冯克威;赵江 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/20;G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 毛丽琴 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种语音识别方法和系统。其中在语音识别方法中,对第一语音信息和第二语音信息进行语音质量评估,选择语音质量较好的语音信息作为参考语音信息,将语音质量较差的语音信息作为辅助语音信息;对参考语音信息进行语音识别,获得参考识别信息;在参考识别信息中选择置信度最高的n个词作为关键词;对于每个关键词,根据预定的词表生成m级相关词集合;提高关键词和相关词在语音识别模型词库中的权重值;利用更新的语音识别模型词库,分别对参考语音信息和辅助语音信息进行语音识别。由于根据对话内容修改了相关词的权重值,从而提高语音识别模型对当前对话内容描述的准确性,提高语音识别的准确率。 | ||
搜索关键词: | 语音 识别 方法 系统 | ||
【主权项】:
一种语音识别方法,其特征在于,包括:从对话语音信息中分别获取第一讲话人的第一语音信息、以及第二讲话人的第二语音信息;分别对第一语音信息和第二语音信息进行语音质量评估,选择语音质量较好的语音信息作为参考语音信息,将语音质量较差的语音信息作为辅助语音信息;对参考语音信息进行语音识别,获得参考识别信息;在参考识别信息中,选择置信度最高的n个词作为关键词,n为大于0的正整数;对于每个关键词,根据预定的词表生成m级相关词集合,其中第一级相关词集合中的每个相关词分别与一个关键词相关联,第L级相关词集合中的每个相关词分别与第L‑1级相关词集合中的一个相关词相关联,m、L为大于0的正整数,2≤L≤m,在m级相关词集合中不包括关键词,同时在m级相关词集合中,相关词也不重复出现;提高关键词和m级相关词集合中的相关词在语音识别模型词库中的权重值,其中为每个权重值乘以一个倍数,关键词的权重增加倍数大于m级相关词集合中相关词的权重增加倍数,第L‑1级相关词集合中相关词的权重增加倍数大于第L级相关词集合中相关词的权重增加倍数,对语音识别模型词库中全部词的权重值进行归一化处理,得到更新的语音识别模型;利用更新的语音识别模型,分别对参考语音信息和辅助语音信息进行语音识别,得到第一识别信息和第二识别信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110440273.4/,转载请声明来源钻瓜专利网。
- 上一篇:脑外科手术辅助支架
- 下一篇:一种具有提示功能的电子体温计