[发明专利]一种基于BiLSTM的陆空通话复诵语义自动校验方法在审
申请号: | 201811365970.6 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109522555A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 贾桂敏;李丹;杨金锋 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于BiLSTM的陆空通话复诵语义自动校验方法。其包括制作陆空通话复诵语料库;对语料库预处理;将每一复诵语句对中两个语句的词向量序列分别输入到两个并列的BiLSTM中,得到两个语句各个时刻的输出;将两个BiLSTM每个时刻的输出向量进行匹配,生成一个复诵语句对间的语义匹配矩阵;对语义匹配矩阵进行k‑Max池化处理,得到前k个匹配特征,由这些匹配特征构成显著匹配特征向量;判定复诵语句对中两个语句复诵是否一致等步骤。本发明利用了BiLSTM网络能够自动学习语句序列的语义特征优势,能够免去人工设计特征的开销,并且BiLSTM网络可以提取出更加丰富的上下文语义特征。 | ||
搜索关键词: | 语句 陆空 匹配特征 矩阵 语义 语义匹配 自动校验 通话 语料库 预处理 上下文语义 人工设计 输出向量 语句序列 语义特征 自动学习 词向量 池化 向量 匹配 判定 并列 网络 输出 制作 | ||
【主权项】:
1.一种基于BiLSTM的陆空通话复诵语义自动校验方法,其特征在于:所述的基于BiLSTM的陆空通话复诵语义自动校验方法包括按顺序进行的下列步骤:步骤1)制作陆空通话复诵语料库;步骤2)对上述陆空通话复诵语料库进行预处理,得到每一复诵语句对中两个语句的词向量序列;步骤3)将上述每一复诵语句对中两个语句的词向量序列分别输入到两个并列的BiLSTM中,利用BiLSTM对语句进行语义特征提取,得到两个语句各个时刻的输出;步骤4)将上述两个BiLSTM每个时刻的输出向量进行匹配,生成一个复诵语句对间的语义匹配矩阵;步骤5)对上述语义匹配矩阵进行k‑Max池化处理,得到前k个匹配特征,由这些匹配特征构成显著匹配特征向量p,以便更好地实现复诵语句对的匹配;步骤6)最后,将步骤5)中得到显著匹配特征向量p输入到多层感知器中得到复诵语句对两个语句间最终的匹配分数s,匹配分数s是一个0到1间的值,并通过阈值0.5来进行二分类,即将匹配分数s与阈值进行比较,如果匹配分数s大于0.5,判定复诵语句对中两个语句复诵一致,否则复诵不一致。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811365970.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种低资源文档分类方法及分类系统
- 下一篇:一种意图识别方法及装置