[发明专利]一种基于自然语言处理的结构化管制指令提取方法有效
申请号: | 201811094551.3 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109460547B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 王煊;盛寅;丁辉;陈平;严勇杰;王冠;徐秋程;才智 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/211;G06F40/253;G06F40/30 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210007 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自然语言处理的结构化管制指令提取方法,通过对非结构化的自然语言形式的管制指令进行处理,该方法可以实现以下辅助功能:提取管制指令中出现的场面、气象等信息并进行汇聚;提取航空器的动作、状态等信息并进行模拟仿真;形成计算机可读的结构化信息为知识推理提供数据。该方法是基于管制指令的自然语言形式结构特点和动词的语法特点。其优点在于可对非结构化的管制指令进行语义分析和处理,而不需要管制员严格地按照固定格式发出管制指令,故本发明极大地提高了管制指令语义分析的适用范围,突破了处理对象必须是结构化的管制指令的限制。 | ||
搜索关键词: | 一种 基于 自然语言 处理 结构 管制 指令 提取 方法 | ||
【主权项】:
1.一种基于自然语言处理的结构化管制指令提取方法,其特征在于,包括如下步骤:步骤1,提取经过语音识别后的管制指令,即文本格式的管制指令,对文本格式的管制指令进行中文分词操作,得到词序列,对词序列中的每个词按对应的词性进行自动标注;步骤2,根据自动标注的结果获取管制指令中的特殊词和特殊词组;步骤3,以特殊词组、特殊词为基本单位构建新的词序列;步骤4,进行句法分析,形成以动词为支配词的依存句法树;步骤5,对特殊词组的用途分类,保留与动词存在依存关系的特殊词组;步骤6,判断特殊词组中动词数量,针对动词数量只有1个和大于1个的两种情况,分别进行处理;步骤7,构建语义网;步骤8,确定谓词和论元关系:谓词和论元之间的关系是由论元所在格的种类确定的,通过语义网找出谓词、论元和关系组成的三元组结构;步骤9,判断空范畴:在谓词和论元关系确定后,还需要判断是否会存在未被填入论元的范畴,即空范畴,若空范畴的存在影响了完整语义的理解,则需要对其进行填充,跳转步骤10;若不存在空范畴,则直接跳转步骤11;步骤10,提取出谓词的空范畴,使用贝叶斯算法进行论元推理并填补空范畴;步骤11,构建计算机可读的结构化模板。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811094551.3/,转载请声明来源钻瓜专利网。