[发明专利]一种连续语音识别结果评价的方法和装置无效
申请号: | 200910088866.1 | 申请日: | 2009-07-21 |
公开(公告)号: | CN101609671A | 公开(公告)日: | 2009-12-23 |
发明(设计)人: | 刘刚;陈伟;郭军;国玉晶 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 连续 语音 识别 结果 评价 方法 装置 | ||
技术领域
本发明涉及语音识别领域,特别是一种连续语音识别结果评价的方法和装置。
背景技术
连续语音识别的结果评价,通常采用动态规划的方法得到最佳匹配结果,隐马尔可夫工具包(Hidden Markov ToolKit,HTK)中的HResults工具是完成这一任务的典型代表。
在进行匹配时,匹配的单元可以是词,也可以是字、音素等,而且只能完成同一层次的匹配,即词词匹配或字字匹配等。在汉语连续语音识别中,通常采用字即音节作为匹配的基元,而基于音素的匹配通常是在只需要评价声学模型性能的时候使用。基于词的匹配由于会产生一些错误匹配,而很少使用。
在基于词的结果匹配中,产生错误匹配的原因主要有两个,一个是分词的标准不统一,汉语与西文不同,词之间没有明显的分界,需要进行分词,但是因为汉语构词比较灵活,造成分词结果的不同,从而产生一些错误匹配。另外一个是语音识别系统的原因,语音识别输出得到的词经常和参考词不一致,即使采用了相同的分词方法(算法、参数、参考词典等等均相同),比如[中国][对][...],识别为[中国队][...],这些造成很多的虚假错误,使得识别结果的评价不可信。
由于语音识别中通常采用基于词的语言模型,网络搜索也是分为词内和词间搜索进行的,因此很多时候,还是需要得到基于词的语音识别结果分析。如做语音识别的可信度研究时,相对于音节来说,词的可信度特征更容易获得,因此很多可信度研究都是在基于词来进行的,但是由于基于词的语音识别结果评价不够准确,严重影响了可信度评价的性能。
发明人在实现本发明的过程中,发现现有技术中至少存在如下问题:
现有技术对基于词的连续语音识别结果评价不准确,产生很多虚假错误,特别是虚假的删除、替代、插入错误。
发明内容
有鉴于此,本发明一个或多个实施例的目的在于提供一种基于字词混合的连续语音识别结果评价方法和装置,以实现更为准确的基于词的连续语音识别结果评价,减少虚假错误的出现。
为解决上述问题,本发明实施例提供了一种基于字词混合的连续语音识别结果评价方法,包括:
根据输入的语音识别结果序列(T序列)和参考序列(R序列),将R序列扩展为字词混合模式,以T为横轴,以R为纵轴,生成字词混合的R-T匹配平面;
根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合匹配的多匹配路径,每条路径采用适当的路径得分;保存每次匹配的最佳路径得分(最小得分),并保存取得最佳得分时的路径信息;
匹配完成后,进行路径回溯,获取最佳匹配路径,得到最佳匹配结果和语音识别结果评价信息,并输出。
本发明还公开了一种基于字词混合的连续语音识别结果评价装置,包括:
输入单元,输入语音识别结果序列(T序列)和参考序列(R序列),保存并作为后续处理单元的数据来源,其中,输入的序列均为词序列;
R-T平面定义单元,根据输入,将R序列扩展为字词混合模式,以T为横轴,以R为纵轴,生成字词混合的R-T匹配平面;
多路径匹配单元,根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合的多匹配路径,每条路径采用适当的路径得分;保存每次匹配的最佳路径得分,并保存取得最佳路径得分时的路径信息;
路径回溯单元,进行路径回溯,获取最佳匹配路径,保存最佳匹配结果,统计识别性能相关信息;
匹配结果输出单元,输出匹配结果和识别性能信息。
与现有技术相比,本发明实施例具有以下优点:本发明实施例通过定义基于字词混合的R-T匹配平面,设计基于字词混合的多匹配路径,使得本发明可以进行基于字词混合的连续语音识别结果评价,并通过设计适当的路径得分,保证不同匹配路径的优先级,提高匹配结果的正确性,有效降低连续语音识别结果评价中虚假错误的产生。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示,是本发明实施例的装置框图;
图1-1所示,是本发明实施例的子装置-多路径匹配单元的框图
图2所示,是本发明实施例的R-T匹配平面示意图;
图3所示,是本发明实施例的多匹配路径示意图;
图4所示,是本发明实施例的路径得分示意图;
图5所示,是本发明实施例的方法流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910088866.1/2.html,转载请声明来源钻瓜专利网。