[发明专利]一种基于改进LSTM-RNN的陆空通话语义一致性校验方法在审
申请号: | 201810311700.0 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108520298A | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 贾桂敏;程方圆;杨金锋 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F17/27 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义向量 语义一致性 陆空 校验 通话 语料库 池化 词表 语义 处理序列 学习样本 统计分析 原有的 自动地 拟合 向量 学习 语句 单词 制作 句子 送入 改进 民航 判决 检验 | ||
一种基于改进LSTM‑RNN的陆空通话语义一致性校验方法。其包括制作语料库:根据民航的通话标准和语料库制作专用词表并获得单词的one‑hot向量:产生每一语句对中两个句子的语义向量;利用平均池化方法来处理语义向量并送入MLP模型中;利用MLP学习出两个语义向量的相关程度;利用KNN来判决语义的一致性。原有的基于LSTM‑RNN处理序列的方法,虽然避免了单独的RNN算法的梯度消失,但检验精度较低,本发明采用了平均池化方法来防止过拟合现象的出现,在计算相关性方面创新的利用了MLP,使得模型对于相关性的学习程度更加充分。由于深度学习利用模型自动地学习样本特征,所以本发明不需要对大量数据进行统计分析。
技术领域
本发明属于民航运输中陆空通话的语义一致性校验技术领域,特别是 涉及一种基于改进LSTM-RNN的陆空通话语义一致性校验方法。
背景技术
在民用航空领域中,管制员与飞行员之间的航空无线电话通信十分重 要,可以说与航空器的安全息息相关。因为陆空通话错误,已经导致了许 多空难的发生。随着科学技术的进步,虽然因为设备以及硬件所造成的陆 空通话错误已经大大减少,但由于管制员或飞行员长时间工作疲劳、精神 紧张、压力过大等人为因素导致的通话错误时有发生。所以,利用人工智 能相关理论和技术对飞行员复诵内容的语义是否与空管员指令的语义一致进行自动化校验与预警,可以有效解决由于人为因素导致的陆空通话错误 问题。
LSTM-RNN模型可以较好解决递归神经网络RNN模型在训练过程的 梯度消失问题。目前,LSTM-RNN模型已经被用于机器翻译,语音识别、 信息检索、内容匹配等工作。我们也将LSTM-RNN和RNN模型应用于陆 空通话的语义匹配中,但是匹配正确率不到85%。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于改进LSTM-RNN 的陆空通话语义一致性校验方法,能够改善最初始的LSTM-RNN/RNN的辨 识精度。
为了达到上述目的,本发明提供的基于改进LSTM-RNN的陆空通话语 义一致性校验方法包括按顺序进行的下列步骤:
步骤1)制作语料库:
步骤1.1)从实际的陆空通话、相关教材和民航局陆空通话标准中,挑 选复诵类型的语句对并存入txt文本中;
步骤1.2)将上述文本中的语句对分成正样本和负样本两种类型,其中 正样本由语义一致性的语句对组成,负样本由语义不一致性的语句对组成;
步骤1.3)对上述语句对进行分词:为了方便描述句子语义,需要对语 句对进行分词,以每个单词为单位将语句对中的句子进行分词,由分词之 后的所有语句对构成语料库;
步骤2)根据民航的通话标准和上述语料库制作专用词表并获得单词的 one-hot向量:
步骤2.1)根据民航的通话标准和上述语料库制作一个专用词表;
步骤2.2)利用上述专用词表获得语料库中所有单词的one-hot向量, 其中:One-hot向量是用一个向量表示一个单词,向量的维度是词表的大小, 其中One-hot向量绝大多数位置的取值为0,只有一个位置的取值为1,这 个位置就代表了当前的单词;
步骤3)产生每一语句对中两个句子的语义向量:
将上述每一语句对中两个句子的所有单词的one-hot向量分别作为一 个单词序列输入到两个LSTM-RNN模型中,以对这两个LSTM-RNN模型 同时进行训练,两个LSTM-RNN模型的输出向量分别为两个句子的语义向 量;
步骤4)对语义向量进行平均池化操作,以提高语义向量的泛化性,同 时降低语义向量的维数;
步骤5)将两个句子的语义向量输入到MLP模型中,通过MLP模型学 习出语义向量的相关程度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810311700.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可编程深度神经网络处理器
- 下一篇:级间激活值量化方法及装置