[发明专利]一种用于个人设备的基于多声学模型的语音识别方法有效
申请号: | 201711112751.2 | 申请日: | 2017-11-13 |
公开(公告)号: | CN107910008B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 吕勇 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L17/16 | 分类号: | G10L17/16;G10L17/04;G10L15/14 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 个人 设备 基于 声学 模型 语音 识别 方法 | ||
本发明公开了一种用于个人设备的基于多声学模型的语音识别方法,为个人设备的每个用户都预配置一个声学模型,这些声学模型在训练阶段都初始化为各个语音单元的SI HMM(Speaker Independent Hidden Markov Model);在测试阶段,通过说话人识别确定当前用户,选择其声学模型进行声学解码,并根据已识别的带标注的输入语音,调整该用户声学模型的参数。本发明可以为个人设备的语音识别模块自动添加说话人模型及其声学模型,增强语音识别系统在不同用户之间切换的环境自适应能力。
技术领域
本发明属于语音识别领域,具体涉及到为个人设备中的语音识别模块配置多个与说话人相关的声学模型,对不同说话人的输入语音采用不同的声学模型进行识别,并根据识别结果调整声学模型参数的语音识别方法。
背景技术
在语音识别系统中,一般用隐马尔可夫模型(HMM:Hidden Markov Model)作为每个语音单元的声学模型。在训练阶段,为每个语音单元采集若干个说话人的发音,用这些语音样本训练生成与说话人无关的(SI:Speaker Independent)HMM。在测试阶段,先根据输入语音对每个语音单元的SI HMM进行说话人自适应,再用自适应后的声学模型对输入语音进行识别。
在语音识别系统的每次应用中,可用的语音是非常有限的,多数HMM没有对应的数据,无法更新其参数。因此,在对SI HMM的说话人自适应中,不得不采用最大似然线性回归等基于不同模型空间相关性的模型自适应方法,假设不同声学模型的若干个高斯单元具有相同的变换关系。这就给说话人自适应带来了较大的误差。在手机、汽车导航仪等个人设备中的语音识别模块通常只有一个或几个常用的用户,所以没有必要在每次应用中都选择与说话人无关的声学模型进行说话人自适应,而是可以为每个用户配置一组与说话人相关的(SD:Speaker Dependent)HMM,并用每个用户的发音数据逐步完善其声学模型。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种用于个人设备的基于多声学模型的语音识别方法。在该方法中,为个人设备的每个用户都预配置一个声学模型,这些声学模型在训练阶段都初始化为各个语音单元的SI HMM;在测试阶段,通过说话人识别确定当前用户,选择其声学模型进行声学解码,并根据已识别的带标注的输入语音,调整该用户声学模型的参数。
本发明的具体步骤如下:
(1)为个人设备的每个用户配置说话人模型;
(2)将每个用户的SD声学模型初始化为SI声学模型;
(3)对输入语音进行说话人识别,得到说话人信息;
(4)根据说话人信息,从多说话人声学模型中选取当前用户的声学模型;
(5)用选取的SD声学模型对输入语音进行声学解码,得到识别结果,并输出带标注的输入语音;
(6)根据带标注的输入语音,对当前用户的SD声学模型进行模型自适应,使其参数与当前用户的输入语音相匹配;
(7)如果输入语音不属于预先配置的任一用户,则选取系统的SI HMM作为其声学模型,并创建新的说话人模型及其声学模型。
附图说明
图1为用于个人设备的基于多声学模型的语音识别系统的总体框架,主要包括说话人识别、多模型选择、声学解码和模型自适应模块。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,基于多声学模型的语音识别方法主要包括说话人识别、多模型选择、声学解码和模型自适应模块。下面逐一详细说明附图中各主要模块的具体实施方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711112751.2/2.html,转载请声明来源钻瓜专利网。