[发明专利]一种基于交互方式的陆空通话复诵差错分类方法在审
申请号: | 201910027246.0 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109766554A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 贾桂敏;程方圆;杨金锋 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62;G06N3/04 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 陆空 差错分类 通话 词向量 矩阵 交互方式 匹配矩阵 匹配向量 语料库 句子 词表 匹配特征 匹配位置 人工设计 统计分析 语义特征 自动实现 自动学习 向量 语句 制作 匹配 词语 民航 分类 改进 | ||
1.一种基于交互方式的陆空通话复诵差错分类方法,其特征在于:所述的方法包括按顺序进行的下列步骤:
步骤1)制作语料库;
步骤2)根据民航的通话标准和上述语料库制作专用词表并获得词语的one-hot词向量,并且对one-hot向量进行简单的改进而得到增强one-hot词向量;
步骤3)利用增强one-hot词向量产生每一复诵对中两个语句的句子矩阵;
步骤4)将每一复诵对中两个句子矩阵进行交互而得到复诵对之间的匹配矩阵;
步骤5)提取上述匹配矩阵的匹配位置和匹配语义特征而得到复诵对之间的匹配向量;
步骤6)利用一个全连接softmax层对上述匹配向量进行分类,由此完成陆空通话复诵差错分类。
2.根据权利要求1所述的基于交互方式的陆空通话复诵差错分类方法,其特征在于:在步骤1)中,所述的制作语料库的方法包括下列步骤:
步骤1.1)从真实的陆空通话录音中挑选出多个复诵类型的语音对作为复诵对,每个复诵对由管制员发送的指令和飞行员复诵指令两个语句组成,然后存储为文本txt格式;
步骤1.2)将上述多个复诵对中复诵正确的复诵对作为正样本,复诵错误的复诵对作为负样本,负样本中包括常见的复诵差错类型:航向信息复诵错误、跑道信息复诵错误、飞机呼号信息复诵错误、高度信息复诵错误、部分信息缺失错误;
步骤1.3)以每个词语为单位将复诵对中的两个语句进行分词,由分词之后的所有复诵对构成语料库。
3.根据权利要求1所述的基于交互方式的陆空通话复诵差错分类方法,其特征在于:在步骤2)中,所述的根据民航的通话标准和上述语料库制作专用词表并获得词语的one-hot词向量,并且对one-hot向量进行简单的改进而得到增强one-hot词向量的方法包括下列步骤:
步骤2.1)根据民航的通话标准和上述语料库制作一个专用词表;
步骤2.2)利用上述专用词表获得语料库中词语的one-hot词向量以及增强one-hot词向量;其中,one-hot词向量中只有一个位置为“1”,其它位置全为“0”,词向量的维度为专用词表的长度;同时,在one-hot词向量之后加入标志位“1”得到增强one-hot词向量。
4.根据权利要求1所述的基于交互方式的陆空通话复诵差错分类方法,其特征在于:在步骤3)中,所述的利用增强one-hot词向量产生每一复诵对中两个语句的句子矩阵的方法是:分别将每一复诵对中两个语句中所有词语的增强one-hot词向量按行进行排列得到两个句子矩阵SP和SATC。
5.根据权利要求1所述的基于交互方式的陆空通话复诵差错分类方法,其特征在于:在步骤4)中,所述的将每一复诵对中两个句子矩阵进行交互而得到复诵对之间的匹配矩阵的方法是:
利用相似度函数计算上述两个句子矩阵SP和SATC中两两词向量之间的相似度而得到一个二维的矩阵,称之为匹配矩阵;
所述的相似度函数为Indicator函数和Dot Product函数,Indicator函数的计算公式如式(1)所示:
在上式中,Mij代表vi和wj的相似度的值,vi和wj分别代表句子矩阵SP和SATC中位置为第i行和第j行的词语的词向量,表示词语之间的余弦相似度,||·||表示向量的
Dot Product函数直接计算两个词向量之间的内积,Dot Product函数的计算公式如式(2)所示:
Mij=(vi)T(wj) (2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027246.0/1.html,转载请声明来源钻瓜专利网。