[发明专利]具有巨大词汇量的语音识别系统有效

专利信息
申请号: 201110128872.2 申请日: 2006-12-06
公开(公告)号: CN102176310A 公开(公告)日: 2011-09-07
发明(设计)人: Z·萨费 申请(专利权)人: 纽昂斯奥地利通讯有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/08;G10L15/18
代理公司: 永新专利商标代理有限公司 72002 代理人: 张扬;王英
地址: 奥地利*** 国省代码: 奥地利;AT
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 具有 巨大 词汇量 语音 识别 系统
【说明书】:

本申请是申请日为2006年12月06日、申请号为200680046025.9、发明名称为“具有巨大词汇量的语音识别系统”的中国专利申请的分案申请。

技术领域

本发明涉及根据声音块识别单词的语音识别系统,尤其涉及连续语音识别器。此外,本发明还涉及根据声音块识别单词的装置和方法,以及实现所述方法的计算机可读代码。

背景技术

在语音识别系统中,输入声音块是由计算机系统将声音块的口头内容的声音特征转换成所识别出的单词来处理的。语音识别是一项复杂的工作,涉及许多步骤。第一步骤通常包括某种声学特征的提取,其中,根据声学资源从声音块中提取表示单词或单词部分的声音特征。随后对声音特征进行评分,声学分值描述了特定单词或单词部分在声音块中的给定位置产生某一特征的概率。图形匹配技术用于根据声音特征的序列确定单词或单词部分的可能序列。以图形结构将单词或单词部分和所分配的分值进行排序,在下一步骤中,通过此图导出最可能的单词序列。将最可能的单词序列记为识别出的单词。

美国专利6,542,866 B1公开了针对一段输入信号生成多个特征向量的方法和装置。解码器生成路径分值,此路径分值指明了此段输入信号表示某一单词的概率。路径分值是通过选择用于每一段的最佳特征向量而生成的。路径分值基于该段的不同特征向量。

现有技术的系统被视为仅能够识别有限量单词的大词汇量连续语音识别器(LVCSR)。除了上述声学处理和图形匹配之外,这样的系统基于用户词典(ULX)和标准单词语言模型(LM)。ULX根据单词部分的序列(音素)识别系统知道的单词。单词LM用于对单词的序列进行评分,由此对高于声学水平的语言水平实现建模。对于每个已知单词而言,标准单词LM基于单词历史统计量,单词历史共由n个单词组成。这样的LM在大规模词库上进行训练,从而观测到足够大量的单词历史,从而获得重要的统计量。通常,对于具有约64000个建模单词的三元文法LM(n=3)而言,所需要的词库具有百万量级的单词规模。因此,通过最新水平的LVCSR来提高可识别单词的数量的主要困难是,需要收集足够大的词库。虽然用户词典和计算机能力在稳步提高,从而可以处理更多的单词,但是,可以识别出的单词量仍然有限。

本发明的发明人已经认识到,能够识别原理上无限量单词的改进的语音识别系统是大有裨益的,因此设计出了本发明。优选情况下,本发明单独或以组合方式减少、削减或消除了现有技术的一个或多个以上或其它缺点。

发明内容

根据本发明的一方面,提供了一种语音识别系统,其根据声音块识别单词,所述语音识别系统包括:

-单词识别器,其通过单词图导出最佳路径,其中,每个单词都分配了一个单词分值和一个音标,并且,基于最佳路径把单词分配给声音块,

其中,单词图中的每个单词的单词分值包括通过将音素语言模型(LM)应用于单词图的每个单词而获得的单词分值。

语音识别系统通常是计算机化的系统,其中,把语音作为声音块输入,例如,由用户通过麦克风作为语音直接输入,由计算机系统作为语音文件输入,由能够输出语音的模拟设备作为声音块输入,等等。语音识别系统可以用作连续语音的在线或离线识别器,以及用作“指令&控制命令”识别器。在这种情况下,(文法)句法信息可以取代音素LM,或与音素LM组合起来使用。语音识别系统可以例如用作用户和计算机系统之间的接口系统。

语音识别系统可以产生单词图,其中,给每个单词都分配了一个单词分值和一个音标,或者,这种单词图可由另一源端产生或提供,并可由单词识别器使用。单词图使得每个单词的单词分值包括通过将音素语言模型(LM)应用于单词图的每个单词而获得的单词分值。可以把单词分值取为声学音素分值和音素LM分值之和。通常,分值是所发现的概率的负对数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯奥地利通讯有限公司,未经纽昂斯奥地利通讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110128872.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top