[发明专利]一种DNN-HMM声学模型参数迁移结构在审
申请号: | 201811176930.7 | 申请日: | 2018-10-10 |
公开(公告)号: | CN109147772A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 马志强;李图雅;韩佳俊 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/16 |
代理公司: | 佛山知正知识产权代理事务所(特殊普通合伙) 44483 | 代理人: | 尧娟 |
地址: | 010080 内蒙古自治*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明通过将一种DNN‑HMM声学模型参数迁移结构对小语料库在声学特征中的改进,具有提高声学模型对声学特征的建模能力,降低小规模数据下语音识别的词错误率和句错误率,以训练小语料库下的DNN‑HMM声学模型,并将其定义的异构模型参数迁移模型和迁移训练算法,在声学模型训练时加入异构模型参数迁移,通过将源数据训练得到的DNN模型的参数迁移到目标数据训练出来的模型中,实现DNN‑HMM异构模型的参数迁移,以此来降低语音识别的词错误率和句错误率等优点,从而有效的解决了现有技术中存在的问题和不足。 | ||
搜索关键词: | 迁移 错误率 声学模型 异构模型 声学模型参数 声学特征 语音识别 语料库 目标数据 训练算法 源数据 建模 改进 | ||
【主权项】:
1.一种DNN‑HMM声学模型参数迁移结构,其特征在于:采用同构模型与异构模型的定义及其参数迁移方法,并将DNN‑HMM模型训练方法与异构模型参数迁移方法进行结合,得出DNN‑HMM异构模型的参数迁移训练算法;包括:(1)同构模型参数迁移;(2)异构模型参数迁移;(3)DNN‑HMM声学模型参数迁移;所述对同构模型参数迁移给出进行定义,其中定义一:模型结构,将深度神经网络的模型结构为M,M=(N,P,F,l),其中N是网络节点N={N1,N2,…,Ni,…,Nl},Ni指神经网络中第i层的节点数;P=![]()
指神经网络第i层到第i+1层的参数矩阵;![]()
指神经网络第i层到第i+1层的权值矩阵;B指偏置向量B={B1,B2,…,Bi,…,B1‑1},Bi指中神经网络第i层的偏置向量;F={g(·),o(·)},其中g(·)表示神经网络隐含层的激活函数,o(·)表示神经网络输出层的函数;l指网络深度;定义二:数据源,DS={Xs,Ys}和DT={XT,YT},S表示源数据,T表示目标数据,X表示输入训练数据,Y表示标签数据;定义三:同构模型,指源模型MS与目标模型MT的N、l和F相同,表示MS=MT;定义四:同构模型参数迁移:指在使用源数据DS构建的源模型MS中WS和BS替换目标数据DT构建的目标模型MT中的WT和BT,得到迁移模型tr‑M,当MS=MT时,表明Ms模型中WS和BS与MT模型中wT和BT属于同型矩阵,在进行模型参数迁移时可以直接将MS模型中参数矩阵迁移到MT模型参数对应的位置上;所述对异构模型参数迁移给出进行定义,其中定义五:异构模型,指源模型Ms与目标模型MT的l相同,F相同,N1到N1‑1相同,N1不相同,表示MS<>MT;定义六:异构模型参数迁移,指在使用源数据DS构建的源模型MS中部分WS和BS对目标数据DT构建的目标模型MT中的WT和BT进行替换,得到迁移模型tr‑M;所述DNN‑HMM声学模型参数迁移将定义的异构模型参数迁移模型和迁移训练算法,在声学模型训练时加入异构模型参数迁移,通过将源数据训练得到的DNN模型的参数迁移到目标数据训练出来的模型中,实现DNN‑HMM异构模型的参数迁移。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811176930.7/,转载请声明来源钻瓜专利网。
- 上一篇:音频分割方法和系统
- 下一篇:一种语音识别装置和方法