[发明专利]用于优化语音识别结果的方法和装置有效

申请号：	201410602377.4	申请日：	2014-10-31
公开（公告）号：	CN105632499B	公开（公告）日：	2019-12-10
发明（设计）人：	雍坤;丁沛;朱会峰	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/06
代理公司：	11247 北京市中咨律师事务所	代理人：	刘瑞东;杨晓光
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于优化语音识别结果方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于优化语音识别结果的装置，包括：

接收单元，其从语音识别引擎接收语音识别结果；

计算单元，其计算上述语音识别结果中的片段的音素序列和关键词列表中的关键词的音素序列之间的音素声学距离，计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离，计算上述音素声学距离和上述音调声学距离的加权平均值，计算将上述加权平均值除以上述关键词的字数、音节数或音素数而得的平均声学距离，基于上述片段中的每个词的语言模型得分来计算上述片段的语言模型得分；以及

替换单元，其在上述平均声学距离低于第1阈值且上述语言模型得分低于第2阈值的情况下，将上述片段替换为上述关键词。

2.根据权利要求1所述的装置，其中，

上述计算单元，计算上述语音识别结果中的语言模型得分低于上述第2阈值的片段和上述关键词列表中的关键词之间的平均声学距离。

3.根据权利要求1所述的装置，其中，

上述计算单元，利用音素混淆矩阵作为权重来计算上述片段的音素序列和上述关键词的音素序列之间的音素声学距离。

4.根据权利要求1所述的装置，其中，

上述计算单元，利用音调混淆矩阵作为权重计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离。

5.一种用于优化语音识别结果的方法，包括以下步骤：

从语音识别引擎接收语音识别结果；

计算上述语音识别结果中的片段的音素序列和关键词列表中的关键词的音素序列之间的音素声学距离；

计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离；

计算上述音素声学距离和上述音调声学距离的加权平均值；