[发明专利]基于语种对的鉴别式语种识别模型建立方法有效

专利信息
申请号: 200910235393.3 申请日: 2009-10-13
公开(公告)号: CN101702314A 公开(公告)日: 2010-05-05
发明(设计)人: 张卫强;刘加 申请(专利权)人: 清华大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/14
代理公司: 北京众合诚成知识产权代理有限公司 11246 代理人: 朱琨
地址: 100084 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语种 鉴别 识别 模型 建立 方法
【说明书】:

技术领域

发明属于语音识别领域,具体地说,涉及一种基于语种对的鉴别式模型建 立方法,可用于语种识别。

背景技术

语种识别是指使用计算机从一段语音信号中自动识别出其语言的种类。语 种识别技术主要用于多语种人机交互、语音信息侦听以及语音文档检索等系统。

语种识别模型可以分为描述性模型和鉴别性模型两类。描述性模型对各语 种的分布进行建模,侧重于使用非参数化或参数化的方法对每个语种进行刻画, 如早期的VQ(矢量量化)和后来的GMM(高斯混合模型),以及PPRLM(并 行音素识别器后接语言模型)等;而鉴别性模型对各语种的分类面进行建模, 侧重于分类,如近期兴起的SVM(支持矢量机)、SVM GSV(基于GMM超矢 量的SVM)和PPR-VSM(并行音素识别器后接矢量空间模型)等。在语种识 别中,描述性模型一般具有较好的推广能力,特别是对于没有参与训练的集外 语种,也不容易出现虚警;而鉴别性模型一般具有更好的分类能力,其识别性 能通常高于传统的描述性模型。

后来,学者们陆续采用一些鉴别性的准则对原来的描述性模型进行训练, 并通过模型插值等手段使其兼有描述性模型和鉴别性模型的优点,从而识别性 能显著提高。在连续语音识别领域,目前比较广泛使用的鉴别性准则有(MCE) 最小分类错误、(MMI)最大互信息、(MPE)最小音素错误等准则。

本发明主要涉及到GMM模型的鉴别式建模。对于该模型,传统的建模方 法是基于ML(最大似然)准则的,它采用一种“各扫自家门前雪”的描述性策 略,每个语种的模型仅用本类的数据训练,使似然度最大化。但事实上各个语 种的似然度的最大化只能保证模型对数据描述得更好,却并不一定有利于分类, 换句话说,ML准则并不能保证最好的识别性能。2003年至2006年期间,Qu 和Matejka等人将MMI准则引入语种识别中的GMM建模,MMI准则采用一种 “统筹兼顾”的鉴别性策略,使训练数据和语种类别之间的互信息最大化,从 而使识别性能得到了很大的提高。

但是由于MMI准则是同时将每一个语种与其他所有语种进行鉴别,没有充 分考虑各语种间的混淆情况;另外MMI准则从整体考虑,目标函数的要求十分 严格,考虑到实际数据分布情况复杂,各语种的数据量不同,混淆程度也各异, 再加上迭代算法仅能达到局部极值等原因,这种的准则可能无法达到。

发明内容

为了解决现有MMI准则的不足,本发明提供一种基于语种对的鉴别式建模方 法,首先从鉴别信息的角度出发,从易混语种对的鉴别入手,放松对MMI准则 的约束。使用数字集成电路实现时,采用本发明耗费的存储和运算模块资源与 MMI方法相同,而等错率相对降低25%。

本发明的特征在于所述方法是在数字集成电路芯片中按以下步骤实现的:

步骤(1):初始化

在所述集成电路中建立以下模块:特征提取模块、最大似然ML准则训练模 块、分子统计量计算模块、分母统计量计算模块、分子统计量平滑模块、更新 系数计算模块以及模型参数更新模块;

步骤(2):对CallFriend数据库12个语种的电话对话语音通过所述特征提取 模块提取7维Mel频率倒谱系数MFCC,再计算偏移差分倒谱SDC特征向量, 其计算公式为:

sk(i)=x(i+3k+1)-x(i+3k-1),k=0,1,...,6

其中x(i)表示第i帧MFCC特征向量,k为SDC特征向量的块标号,k=0,1,...,6, 共7块,每块7维,连同7维MFCC特征一起拼接成56维的特征向量;

步骤(3):在所述最大似然ML准则训练模块中,用Baum-Welch算法对步 骤(2)中得到的数据进行最大似然ML训练,得到所述12个语种高斯混合模 型GMM的初始参数,其中第l个语种的参数用λl表示:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910235393.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top