[发明专利]一种用于个人设备的基于多声学模型的语音识别方法有效

申请号：	201711112751.2	申请日：	2017-11-13
公开（公告）号：	CN107910008B	公开（公告）日：	2021-06-11
发明（设计）人：	吕勇	申请（专利权）人：	河海大学
主分类号：	G10L17/16	分类号：	G10L17/16;G10L17/04;G10L15/14
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	李玉平
地址：	210098 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于个人设备基于声学模型语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于个人设备的基于多声学模型的语音识别方法，其特征在于：为个人设备的每个用户都预配置一个声学模型，这些声学模型在训练阶段都初始化为各个语音单元的SIHMM(Speaker Independent Hidden Markov Model)；在测试阶段，通过说话人识别确定当前用户，选择其声学模型进行声学解码，并根据已识别的带标注的输入语音，调整该用户声学模型的参数；

具体包括：

(1)为个人设备的每个用户配置说话人模型；

(2)将每个用户的SD(Speaker Dependent)声学模型初始化为SI声学模型；

(3)对输入语音进行说话人识别，得到说话人信息；

(4)根据说话人信息，从多说话人声学模型中选取当前用户的声学模型；

(5)用选取的SD声学模型对输入语音进行声学解码，得到识别结果，并输出带标注的输入语音；

(6)根据带标注的输入语音，对当前用户的SD声学模型进行模型自适应，使其参数与当前用户的输入语音相匹配；

(7)如果输入语音不属于预先配置的任一用户，则选取系统的SI HMM作为其声学模型，并创建新的说话人模型及其声学模型；

其中，在模型自适应时，记录第i个SD声学模型的第j个语音单元HMM获得的语音样本数目N_ij，并用N_ij对用当前输入语音计算得到的模型参数与原模型参数加权相加，作为当前HMM的新模型参数。

2.根据权利要求1所述的一种用于个人设备的基于多声学模型的语音识别方法，其特征在于：对当前语音单元的HMM，用输入语音计算模型的参数，并与原模型参数加权相加，作为当前HMM的新参数：

其中，λ表示用当前输入语音计算得到的高斯单元的均值，λ_N表示用以前N_ij个语音样本计算得到的高斯单元的均值，λ_N+1表示当前HMM的新的均值；同时，N_ij的值加1；

对其他语音单元的HMM，若N_ij≥1，则对其参数不做调整，保持原值即可；若N_ij＝0，则用最大似然线性回归调整其每个高斯单元的均值和方差。