[发明专利]用于优化语音识别结果的方法和装置有效
| 申请号: | 201410602377.4 | 申请日: | 2014-10-31 |
| 公开(公告)号: | CN105632499B | 公开(公告)日: | 2019-12-10 |
| 发明(设计)人: | 雍坤;丁沛;朱会峰 | 申请(专利权)人: | 株式会社东芝 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06 |
| 代理公司: | 11247 北京市中咨律师事务所 | 代理人: | 刘瑞东;杨晓光 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 优化 语音 识别 结果 方法 装置 | ||
1.一种用于优化语音识别结果的装置,包括:
接收单元,其从语音识别引擎接收语音识别结果;
计算单元,其计算上述语音识别结果中的片段的音素序列和关键词列表中的关键词的音素序列之间的音素声学距离,计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离,计算上述音素声学距离和上述音调声学距离的加权平均值,计算将上述加权平均值除以上述关键词的字数、音节数或音素数而得的平均声学距离,基于上述片段中的每个词的语言模型得分来计算上述片段的语言模型得分;以及
替换单元,其在上述平均声学距离低于第1阈值且上述语言模型得分低于第2阈值的情况下,将上述片段替换为上述关键词。
2.根据权利要求1所述的装置,其中,
上述计算单元,计算上述语音识别结果中的语言模型得分低于上述第2阈值的片段和上述关键词列表中的关键词之间的平均声学距离。
3.根据权利要求1所述的装置,其中,
上述计算单元,利用音素混淆矩阵作为权重来计算上述片段的音素序列和上述关键词的音素序列之间的音素声学距离。
4.根据权利要求1所述的装置,其中,
上述计算单元,利用音调混淆矩阵作为权重计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离。
5.一种用于优化语音识别结果的方法,包括以下步骤:
从语音识别引擎接收语音识别结果;
计算上述语音识别结果中的片段的音素序列和关键词列表中的关键词的音素序列之间的音素声学距离;
计算上述片段的音调序列和上述关键词的音调序列之间的音调声学距离;
计算上述音素声学距离和上述音调声学距离的加权平均值;
计算平均声学距离,上述平均声学距离通过上述加权平均值除以上述关键词的字数、音节数或音素数来获取;
基于上述片段中的每个词的语言模型得分来计算上述片段的语言模型得分;以及
在上述平均声学距离低于第1阈值且上述语言模型得分低于第2阈值的情况下,将上述片段替换为上述关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410602377.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:主成分分析PCA映射模型的编解码方法及装置
- 下一篇:一种语音识别方法和装置





