[发明专利]具有巨大词汇量的语音识别系统有效
申请号: | 201110128872.2 | 申请日: | 2006-12-06 |
公开(公告)号: | CN102176310A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | Z·萨费 | 申请(专利权)人: | 纽昂斯奥地利通讯有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L15/18 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张扬;王英 |
地址: | 奥地利*** | 国省代码: | 奥地利;AT |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 巨大 词汇量 语音 识别 系统 | ||
1.一种语音识别系统,其根据声音块(40)识别单词,所述语音识别系统包括:
单词识别器(49),其通过单词图(46)导出最佳路径(47),其中,给每个单词都分配了一个单词分值和一个音标,单词是基于所述最佳路径分配给所述声音块的,
其中,所述单词图中的每个单词的单词分值包括通过将音素语言模型(36)应用于所述单词图的每个单词而获得的单词分值。
2.根据权利要求1所述的语音识别系统,所述语音识别系统基于包括多于200.000个单词的允许单词词典(12)。
3.根据权利要求1所述的语音识别系统,还包括:
音素识别器(41),其从所述声音块(40)中提取音素图(42,61),所述音素图用于给每个边界分配一个音素,
其中,所述单词图中的单词的音标基于所述音素图。
4.根据权利要求3所述的语音识别系统,其中,给每个音素分配一个声学音素分值。
5.根据权利要求3所述的语音识别系统,还包括:
单词音素图生成器(43),其用于把所述音素图(42,61)转换成单词音素图(44),所述单词音素图用于给每个边界分配一个单词和相关的音标。
6.根据权利要求5所述的语音识别系统,其中,确定音素序列假设(60),并将其添加到所述音素图中,从而提供扩展音素图(42,61),其中,所述单词音素图(44)基于所述扩展音素图。
7.根据权利要求5所述的语音识别系统,其中,通过应用允许单词词典(12),对所述扩展音素图(42,61)进行滤波,从而把含有在所述词典中不存在的单词的扩展音素图的音素序列剔除掉。
8.根据权利要求5所述的语音识别系统,其中,提供时间同步的单词音素图(46),其中,从所述单词音素图(44)中剔除在时间上前后均无接连的单词。
9.根据权利要求5所述的语音识别系统,还包括:
单词图生成器(45),其将所述单词音素图(44)转换成单词图(46),所述单词图用于给每个边界分配一个单词。
10.根据权利要求1所述的语音识别系统,其中,所述音素语言模型(36)是m元文法语言模型或紧凑的变元文法模型(variagram)。
11.一种根据声音块识别单词的方法,其中,通过单词图导出最佳路径,其中给每个单词都分配了一个单词分值,并且,基于所述最佳路径把单词分配给所述声音块,所述单词图中的每个单词的分值包括通过将音素语言模型应用于所述单词图的每个单词而获得的单词分值。
12.一种根据声音块识别单词的装置,所述装置包括:
-语音传感器,其根据声音块(40)捕获语音,
-语音识别系统,
-输出模块,其把识别出的单词输出,
其中,所述语音识别系统包括:
-单词识别器(49),其通过单词图(46)导出最佳路径(47),其中,给每个单词都分配了一个单词分值,并且,基于所述最佳路径把单词分配给所述声音块(40),以及
其中,所述单词图中的每个单词的单词分值包括通过将音素语言模型(36)应用于所述单词图的每个单词而获得的单词分值。
13.计算机可读代码,用于实现权利要求11的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯奥地利通讯有限公司,未经纽昂斯奥地利通讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110128872.2/1.html,转载请声明来源钻瓜专利网。