[发明专利]一种用于个人设备的基于多声学模型的语音识别方法有效
申请号: | 201711112751.2 | 申请日: | 2017-11-13 |
公开(公告)号: | CN107910008B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 吕勇 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L17/16 | 分类号: | G10L17/16;G10L17/04;G10L15/14 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 个人 设备 基于 声学 模型 语音 识别 方法 | ||
1.一种用于个人设备的基于多声学模型的语音识别方法,其特征在于:为个人设备的每个用户都预配置一个声学模型,这些声学模型在训练阶段都初始化为各个语音单元的SIHMM(Speaker Independent Hidden Markov Model);在测试阶段,通过说话人识别确定当前用户,选择其声学模型进行声学解码,并根据已识别的带标注的输入语音,调整该用户声学模型的参数;
具体包括:
(1)为个人设备的每个用户配置说话人模型;
(2)将每个用户的SD(Speaker Dependent)声学模型初始化为SI声学模型;
(3)对输入语音进行说话人识别,得到说话人信息;
(4)根据说话人信息,从多说话人声学模型中选取当前用户的声学模型;
(5)用选取的SD声学模型对输入语音进行声学解码,得到识别结果,并输出带标注的输入语音;
(6)根据带标注的输入语音,对当前用户的SD声学模型进行模型自适应,使其参数与当前用户的输入语音相匹配;
(7)如果输入语音不属于预先配置的任一用户,则选取系统的SI HMM作为其声学模型,并创建新的说话人模型及其声学模型;
其中,在模型自适应时,记录第i个SD声学模型的第j个语音单元HMM获得的语音样本数目Nij,并用Nij对用当前输入语音计算得到的模型参数与原模型参数加权相加,作为当前HMM的新模型参数。
2.根据权利要求1所述的一种用于个人设备的基于多声学模型的语音识别方法,其特征在于:对当前语音单元的HMM,用输入语音计算模型的参数,并与原模型参数加权相加,作为当前HMM的新参数:
其中,λ表示用当前输入语音计算得到的高斯单元的均值,λN表示用以前Nij个语音样本计算得到的高斯单元的均值,λN+1表示当前HMM的新的均值;同时,Nij的值加1;
对其他语音单元的HMM,若Nij≥1,则对其参数不做调整,保持原值即可;若Nij=0,则用最大似然线性回归调整其每个高斯单元的均值和方差。
3.根据权利要求2所述的一种用于个人设备的基于多声学模型的语音识别方法,其特征在于:公式
其中,λ表示用当前输入语音计算得到的高斯单元的方差,λN表示用以前Nij个语音样本计算得到的高斯单元的方差,λN+1表示当前HMM的新的方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711112751.2/1.html,转载请声明来源钻瓜专利网。