[发明专利]基于语种对的鉴别式语种识别模型建立方法有效
申请号: | 200910235393.3 | 申请日: | 2009-10-13 |
公开(公告)号: | CN101702314A | 公开(公告)日: | 2010-05-05 |
发明(设计)人: | 张卫强;刘加 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 朱琨 |
地址: | 100084 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语种 鉴别 识别 模型 建立 方法 | ||
1.基于语种对的鉴别式语种识别模型建立方法,其特征在于,所述方法是在数 字集成电路芯片中依次按以下步骤实现的:
步骤(1):初始化
在所述集成电路中建立以下模块:特征提取模块、最大似然ML准则训练模 块、分子统计量计算模块、分母统计量计算模块、分子统计量平滑模块、更新 系数计算模块以及模型参数更新模块;
步骤(2):对CallFriend数据库12个语种的电话对话语音通过所述特征提取 模块提取7维Mel频率倒谱系数MFCC,再计算偏移差分倒谱SDC特征向量, 其计算公式为:
sk(i)=x(i+3k+1)-x(i+3k-1),k=0,1,...,6
其中x(i)表示第i帧MFCC特征向量,k为SDC特征向量的块标号,k=0,1,...,6, 共7块,每块7维,连同7维MFCC特征一起拼接成56维的特征向量 {x(i),s0(i),s1(i),…,s6(i)};
步骤(3):在所述最大似然ML准则训练模块中,用Baum-Welch算法对步 骤(2)中得到的数据进行最大似然ML训练,得到所述12个语种高斯混合模 型GMM的初始参数,其中第l个语种的参数用λl表示:
其中下标g表示高斯分量标号,每个语种含G个高斯分量,下标l表示语种标号, l=1,...,L,共L=12个语种,wlg表示第l个语种第g个高斯分量的权重,μlg表示 第l个语种第g个高斯分量的均值,表示第l个语种第g个高斯分量的方差;
步骤(4):分别用分子统计量计算模块和分母统计量计算模块计算所述各语 种的分子统计量和分母统计量:
在所述分子统计量中:
零阶分子统计量
一阶分子统计量
二阶分子统计量
在所述分母统计量中:
零阶分母统计量
一阶分母统计量
二阶分母统计量
其中上标“num”代表分子项,上标“den”代表分母项,θ(1)、θ(χ)和θ(χ2)分 别代表零阶、一阶和二阶统计量,χ为所述特征向量的随机变量,R为总段数, r=1,2,...,R,Tr为第r段语音的帧数,i=1,2,...,Tr,Xr(i)代表第r段语音的第i帧特 征向量的取值,为第l个语种分子项中Xr(i)属于第g个高斯分量的后验概 率,为第l个语种分母项中Xr(i)属于第g个高斯分量的后验概率,其中:
其中下标g′是不同于g的高斯分量标号,下标l′是不同于l的语种标号, 表示均值为μlg,方差为的高斯分布在随机变量取值为Xr(i)时 的概率密度,pλ(Xr|l)为第r段语音在第l个语种参数下的条件概率密度 K为修正因子,取值为6/Tr,对所有语种 l=1,...,L和所有高斯分量g=1,...,G循环进行上述计算;
零阶分子统计量表示所有R段的各段语音的各帧特征向量分别属于第 g个高斯分量的后验概率之和,一阶分子统计量表示所有R段的各 段语音的各帧特征向量分别属于第g个高斯分量的后验概率与本帧特征向 量的乘积之和,二阶分子统计量表示所有R段的各段语音的各帧特征向 量分别属于第g个高斯分量的后验概率与本帧特征向量平方的乘积之和, 对于各阶分母统计量依此类推;
步骤(5):对步骤(4)中得到的分子统计量进行平滑处理:
用
用
用
其中τI为平滑因子,取值为100,对所有语种l=1,...,L和所有高斯分量g=1,...,G循 环进行上述计算;
步骤(6):由分子统计量和分母统计量计算模型参数μlg和的更新系数Dlg:
其中Dmin是关于D的一元二次方程的两个解中较大的一个:
对所有语种l=1,...,L和所有高斯分量g=1,...,G循环进行上述计算;
步骤(7):修正模型参数μlg和得到新的模型参数和
对所有语种l=1,...,L和所有高斯分量g=1,...,G循环进行上述计算;
步骤(8):设定所有R段语音数据的目标函数为:
当迭代次数大于20次或相邻两次迭代目标函数的变化量小于1.0×10-5则停止迭 代,否则,用代替μlg,代替σlg,转步骤(4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910235393.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高阻抗低衰减高速传输线
- 下一篇:旋风式空滤器