[发明专利]一种针对民航陆空通话领域的基于迁移学习的语音识别方法在审
申请号: | 201910571280.4 | 申请日: | 2019-06-25 |
公开(公告)号: | CN112133290A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 杨群;孙修松;刘绍翰 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/14;G10L15/16;G10L15/26;G10L25/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 民航 陆空 通话 领域 基于 迁移 学习 语音 识别 方法 | ||
1.一种针对民航陆空通话领域的基于迁移学习的语音识别方法,所述方法包括:
收集通用数据集和迁移数据集并做数据处理;
初始化神经网络,采用时延神经网络-隐马尔可夫模型作为声学训练模型;
使用通用数据集进行语音识别训练,得到中文语音识别通用模型;
对所述迁移数据集在通用中文语音识别模型上进行训练并调整参数,得到民航陆空通话领域中文语音识别模型;
扩充民航领域文本语料,生成语言模型;
2.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于收集通用数据集和迁移数据集并做数据处理,具体包括:
获取通用中文语音数据集并做数据风格迁移作为训练数据集;
获取民航陆空通话领域中文语音数据集作为迁移训练数据集;
对所述训练数据集和迁移训练数据集进行指定特征提取,并对所述数据转换得到特征向量;
3.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于从预训练模型和目标模型中找到共享的参数信息,以实现模型迁移,具体包括:
给出训练集来自于通用中文语音数据集,Ds表示有标签源领域数据,xi表示输入特征,yi表示特征对应标签数据。Ds服从于某种数据分布Ps(x,y)。通过预训练确定神经网络权值矩阵Ws,得到预训练模型;
给出迁移学习数据集来自于民航陆空通话领域中文语音数据集。将输入特征及对应标签数据在预训练模型上进行迁移训练,以最小化损失函数为目标调整神经网络权值矩阵Ws,得到新权值矩阵Wt及最终模型;
4.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于,根据民航陆空通话领域语料,生成领域内专用语言模型,具体包括:
根据所述民航陆空通话领域文本语料生成大量文本语料以训练语言模型;
训练所述文本语料,统计词与词之间同时出现概率,生成民航陆空通话领域语言模型;
5.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于,初试化神经网络,采用时延神经网络-隐马尔可夫模型作为声学训练模型,具体包括:
选择合适的神经网络激活函数;
配置相应的神经网络隐层以防止过拟合现象的产生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910571280.4/1.html,转载请声明来源钻瓜专利网。