[发明专利]用于优化语音识别结果的方法和装置有效

申请号：	201410602377.4	申请日：	2014-10-31
公开（公告）号：	CN105632499B	公开（公告）日：	2019-12-10
发明（设计）人：	雍坤;丁沛;朱会峰	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/06
代理公司：	11247 北京市中咨律师事务所	代理人：	刘瑞东;杨晓光
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于优化语音识别结果方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供用于优化语音识别结果的方法和装置。根据一个实施方式，用于优化语音识别结果的装置包括：接收单元，其接收语音识别结果；计算单元，其计算上述语音识别结果中的片段和关键词列表中的关键词之间的发音相似度；以及替换单元，其在上述发音相似度高于第1阈值的情况下，将上述片段替换为上述关键词。

技术领域

本发明涉及语音识别技术，具体地，涉及用于优化语音识别结果的方法和装置。

背景技术

在语音识别的一些应用场景中，说话内容往往包含一些关键词，这些关键词能否被正确识别出来密切影响着语音识别系统的用户体验。例如，在会议支援应用中，语音识别系统把发言人说话的内容识别出来，而会议中所涉及的重要人名、地名、技术术语等词汇就是关键词，其识别率是此类应用最主要的性能指标。

关键词可以分为两类，如果关键词不在语音识别的系统词典里，可称之为新词，如果在词典内，则可称之为核心词。由于新词未在系统词典里注册，而语音识别系统只能输出系统词典里存在的词条，所以新词完全无法被直接识别出来。

虽然大部分新词可以由系统词典里的词条拼接后间接输出，但由于这种拼接的情况在训练语料里很少见，导致其语言模型得分很低，因此被成功识别出来的概率依然很小。

对已在系统词典里注册过的核心词而言，如果系统词典里存在其他发音相同或相似但语言模型得分更高的非核心词，则语音识别系统会错误的选择该非核心词作为输出结果。

因此，普通的语音识别系统对关键词的识别率都很低，而错误的识别结果一般都是读音相同或相似的其他词汇。

提高关键词的识别率的关键是提升关键词的语言模型得分。通常，使用基于类的语音模型来提升关键词的语言模型得分。在该方法中，可以创建一些类来对应各种关键词，如人名类、地名类、技术术语类等，并在系统词表里挑选一定数目符合某类别性质的典型词汇加入相应的类。在训练语言模型时，每个类的语言模型得分由对该类所包含的所有典型词汇共同统计后得出。在语音识别之前，把关键词添加到系统词典里并关联到所属的类，而在语音识别的过程中，关键词则共享其所属类的语言模型得分。由于典型词汇的语言模型得分都比较高，所以关键词的语言模型得分被大为提升，其识别率也得以大幅度提高。

发明内容

本发明的发明人发现即使采用上述基于类的语言模型方法，仍然有一定比例的关键词不能被正确识别，从而影响语音识别系统，尤其是会议支援系统中的用户体验。

为了解决现有技术中存在的上述问题，本发明的实施方式提供是一种通过关键词列表优化语音识别结果的语音识别后处理技术，其不涉及对语音识别引擎的修改，功能实现非常容易，计算量非常小，使用方便，添加或更改关键词只需修改对应的关键词列表文件。具体而言，提供以下用于优化语音识别结果的技术方案。

[1]一种用于优化语音识别结果的方法，包括以下步骤：

接收语音识别结果；

计算上述语音识别结果中的片段和关键词列表中的关键词之间的发音相似度；以及

在上述发音相似度高于第1阈值的情况下，将上述片段替换为上述关键词。

上述方案[1]的用于优化语音识别结果的方法，通过关键词列表对语音识别结果中被错误识别的关键词进行优化，能够提高语音识别结果的质量，改善语音识别系统，尤其是会议支援系统的性能。上述方案[1]的方法不涉及对语音识别引擎的修改，功能实现非常容易，计算量非常小，使用方便，添加或更改关键词只需修改对应的关键词列表文件。

[2]根据上述[1]所述的方法，其中，上述替换步骤包括以下步骤：

在上述发音相似度高于上述第1阈值且上述片段的语言模型得分低于第2阈值的情况下，将上述片段替换为上述关键词。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社东芝，未经株式会社东芝许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410602377.4/2.html，转载请声明来源钻瓜专利网。

上一篇：主成分分析PCA映射模型的编解码方法及装置
下一篇：一种语音识别方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于优化语音识别结果的方法和装置有效

专利文献下载