[发明专利]一种基于LSTM-RNN的陆空通话语义一致性校验方法有效

专利信息
申请号: 201610478551.8 申请日: 2016-06-22
公开(公告)号: CN106156848B 公开(公告)日: 2018-08-14
发明(设计)人: 杨金锋;路玉君;师一华;贾桂敏 申请(专利权)人: 中国民航大学
主分类号: G06N3/04 分类号: G06N3/04;G06F17/27
代理公司: 天津才智专利商标代理有限公司 12108 代理人: 庞学欣
地址: 300300 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于LSTM‑RNN的陆空通话语义一致性校验方法。其包括制作语料库:根据民航的通话标准和上述语料库制作专用词表并获得单词的one‑hot向量:产生每一句子对中两个句子的语义向量;计算上述两个句子的语义向量的余弦相似度;根据上述余弦相似度利用逻辑回归法、K近邻法或随机森林法来校验两个句子的语义是否一致等步骤。本发明提供的基于利用RNN处理序列的优势,在计算句子语义向量的过程中充分考虑了句子中单词之间的关联性。由于深度学习利用模型自动地学习样本特征,所以本发明不需要对大量数据进行统计分析。
搜索关键词: 一种 基于 lstm rnn 陆空 通话 语义 一致性 校验 方法
【主权项】:
1.一种基于LSTM‑RNN的陆空通话语义一致性校验方法,其特征在于:所述的基于LSTM‑RNN的陆空通话语义一致性校验方法包括按顺序进行的下列步骤:步骤1)制作语料库:步骤1.1)从实际的陆空通话中挑选出复述类型的句子对并存入txt文本中;步骤1.2)将上述文本中的句子对分成正样本和负样本两种类型,其中正样本由语义一致性的句子对组成,负样本由语义不一致性的句子对组成;步骤1.3)对上述句子对进行分词:为了方便描述句子语义,需要对句子对进行分词,以每个单词为单位将句子进行分词,由分词之后的所有句子对构成语料库;步骤2)根据民航的通话标准和上述语料库制作专用词表并获得单词的one‑hot向量:步骤2.1)根据民航的通话标准和上述语料库制作一个专用词表;步骤2.2)利用上述专用词表获得语料库中所有单词的one‑hot向量;步骤3)产生每一句子对中两个句子的语义向量:将上述每一句子对中两个句子的所有单词的one‑hot向量分别作为一个单词序列输入到两个RNN模型或者两个LSTM‑RNN模型中,以对两个模型同时进行训练,两个模型的输出向量分别为两个句子的语义向量;步骤4)计算上述两个句子的语义向量的余弦相似度;步骤5)最后根据上述余弦相似度利用逻辑回归法、K近邻法或随机森林法来校验两个句子的语义是否一致。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610478551.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top