[发明专利]一种针对民航陆空通话领域的端到端的自动语音识别方法在审

专利信息
申请号: 201910571279.1 申请日: 2019-06-25
公开(公告)号: CN112133292A 公开(公告)日: 2020-12-25
发明(设计)人: 杨群;周凯;刘绍翰 申请(专利权)人: 南京航空航天大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L15/183;G10L15/26
代理公司: 暂无信息 代理人: 暂无信息
地址: 211106 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 民航 陆空 通话 领域 端到端 自动 语音 识别 方法
【说明书】:

发明公开一种针对民航陆空通话领域的端到端自动语音识别方法。其中端到端的语音识别方法包括:以端到端模型为声学模型的语音识别的方法;端到端模型的训练方法;基于端到端模型的语音识别方法在民航陆空通话领域的应用。其中端到端模型的训练方法包括:基于最大相关互信息为目标函数的端到端模型训练方法、训练过程中免词格训练方法、特殊的端到端神经网络结构。此外公开了深度学习中的端到端模型在民航陆空通话领域中特殊的数据处理、训练方法以及特殊的应用方法。发明的端到端模型的训练相比于常规的模型需要的时间、样本、机器的性能都有较大的改善。并且在识别效果上相较于常规模型也有改进。

技术领域

本发明涉及智能通话、信号处理以及深度学习领域,特别是涉及一种针对民航陆空通话领域的端到端语音识别方法及系统。

背景技术

随着民航客运、货运业务等迅速扩展,机场飞机活动十分频繁,这给机场空中交通管制员带来了极大的工作压力。因此,我们需要以智能机器辅助管制员进行空中交通管制,以降低空管员工作压力更好地保障机场安全与秩序。进行一切智能辅助的前提是人与机器的智能交互,而最快捷地交互无疑是进行口语交流。因此,本发明一种针对民航陆空通话领域的端到端自动语音识别方法功能即将管制员与飞行员交流的通话转写为文字或是信号以输入计算机辅助程序。

传统的自动语音识别方法是基于混合高斯模型以及隐马尔科夫模型的,即使是基于深度神经网络的语音识别方法大多数也是需要先训练混合高斯模型以及隐马尔科夫模型以生成对齐文件,并以对齐文件为输入训练深度神经网络模型。这样的语音识别模型训练过程无疑是繁琐的并且耗时耗力,后来随着深度学习不断往端到端模型发展,越来越多的研究者们在图像识别、自然语言处理以及语音识别领域成功地应用了端到端模型。端到端模型其比上述传统模型以及常规深度模型不同指出在于端到端模型的训练无需预训练一个传统模型以获取对齐文件、也无需生成树结构的上下文相关模型甚至无需语言模型即可进行训练。然而研究表明加上语言模型可以进一步提高识别效果,因此本发明中语言模型作为一个可选模块根据具体应用要求可有可无。

本发明一种针对民航陆空通话领域的端到端语音识别方法可以在提高识别效果的前提下,降低训练模型的开销包括时间、人力以及金钱。除此之外,本发明应用于民航陆空通话领域以辅助管制员与飞行员进行交流与记录。

发明内容

本发明的目的是提供一种针对民航陆空通话领域的端到端语音识别方法及系统,提高民航陆空通话的准确性同时降低训练模型的开销成本。

为实现上述目的,本发明提供了如下方案:

一种针对民航陆空通话领域的端到端自动语音识别方法,其特征在于利用端到端模型为声学模型建立的适用于民航陆空通话的自动语音识别方法,所述语音识别方法包括:

以端到端模型为声学模型进行语音识别;

端到端模型的训练方法;

基于端到端模型的语音识别方法在民航陆空通话领域的应用。

根据所述的语音识别方法,其特征在于使用端到端模型作为语音识别的声学模型,利用所述端到端模型进行语音识别,具体包括:

端到端模型的结构特征在于它是基于时延神经网络结构与长短时记忆单元结构的复合神经网络模型;

特殊结构的上下文相关信息模型,用于统计上下文相关信息;

可选的语言模型,用于统计字词间的出现概率,用于解码过程终音素到字词的映射;

将所述基于端到端模型的声学模型结合上下文相关模型即为所述的端到端语音识别模型,可选的附加语言模型可以进一步提高语音识别效果。

根据所述的端到端模型训练方法,其特征在于端到端模型是根据最大相关互信息结合免词格方法训练,具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910571279.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top