[发明专利]一种DNN-HMM声学模型参数迁移结构在审

专利信息
申请号: 201811176930.7 申请日: 2018-10-10
公开(公告)号: CN109147772A 公开(公告)日: 2019-01-04
发明(设计)人: 马志强;李图雅;韩佳俊 申请(专利权)人: 内蒙古工业大学
主分类号: G10L15/14 分类号: G10L15/14;G10L15/16
代理公司: 佛山知正知识产权代理事务所(特殊普通合伙) 44483 代理人: 尧娟
地址: 010080 内蒙古自治*** 国省代码: 内蒙古;15
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明通过将一种DNN‑HMM声学模型参数迁移结构对小语料库在声学特征中的改进,具有提高声学模型对声学特征的建模能力,降低小规模数据下语音识别的词错误率和句错误率,以训练小语料库下的DNN‑HMM声学模型,并将其定义的异构模型参数迁移模型和迁移训练算法,在声学模型训练时加入异构模型参数迁移,通过将源数据训练得到的DNN模型的参数迁移到目标数据训练出来的模型中,实现DNN‑HMM异构模型的参数迁移,以此来降低语音识别的词错误率和句错误率等优点,从而有效的解决了现有技术中存在的问题和不足。
搜索关键词: 迁移 错误率 声学模型 异构模型 声学模型参数 声学特征 语音识别 语料库 目标数据 训练算法 源数据 建模 改进
【主权项】:
1.一种DNN‑HMM声学模型参数迁移结构,其特征在于:采用同构模型与异构模型的定义及其参数迁移方法,并将DNN‑HMM模型训练方法与异构模型参数迁移方法进行结合,得出DNN‑HMM异构模型的参数迁移训练算法;包括:(1)同构模型参数迁移;(2)异构模型参数迁移;(3)DNN‑HMM声学模型参数迁移;所述对同构模型参数迁移给出进行定义,其中定义一:模型结构,将深度神经网络的模型结构为M,M=(N,P,F,l),其中N是网络节点N={N1,N2,…,Ni,…,Nl},Ni指神经网络中第i层的节点数;P=指神经网络第i层到第i+1层的参数矩阵;指神经网络第i层到第i+1层的权值矩阵;B指偏置向量B={B1,B2,…,Bi,…,B1‑1},Bi指中神经网络第i层的偏置向量;F={g(·),o(·)},其中g(·)表示神经网络隐含层的激活函数,o(·)表示神经网络输出层的函数;l指网络深度;定义二:数据源,DS={Xs,Ys}和DT={XT,YT},S表示源数据,T表示目标数据,X表示输入训练数据,Y表示标签数据;定义三:同构模型,指源模型MS与目标模型MT的N、l和F相同,表示MS=MT;定义四:同构模型参数迁移:指在使用源数据DS构建的源模型MS中WS和BS替换目标数据DT构建的目标模型MT中的WT和BT,得到迁移模型tr‑M,当MS=MT时,表明Ms模型中WS和BS与MT模型中wT和BT属于同型矩阵,在进行模型参数迁移时可以直接将MS模型中参数矩阵迁移到MT模型参数对应的位置上;所述对异构模型参数迁移给出进行定义,其中定义五:异构模型,指源模型Ms与目标模型MT的l相同,F相同,N1到N1‑1相同,N1不相同,表示MS<>MT;定义六:异构模型参数迁移,指在使用源数据DS构建的源模型MS中部分WS和BS对目标数据DT构建的目标模型MT中的WT和BT进行替换,得到迁移模型tr‑M;所述DNN‑HMM声学模型参数迁移将定义的异构模型参数迁移模型和迁移训练算法,在声学模型训练时加入异构模型参数迁移,通过将源数据训练得到的DNN模型的参数迁移到目标数据训练出来的模型中,实现DNN‑HMM异构模型的参数迁移。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811176930.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top