[发明专利]一种基于实体关系抽取的结构化机场警报处理方法有效
申请号: | 202110564234.9 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113268595B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 王煊;陈曦;刘泽原;黄吉波;丁辉;吴靓浩;刘岩 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/332;G06F16/36;G06Q50/26 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 实体 关系 抽取 结构 机场 警报 处理 方法 | ||
1.一种基于实体关系抽取的结构化机场警报处理方法,其特征在于,包括如下步骤:
步骤1,获取并预处理机场警报数据,输出非结构化文本数据;
步骤2,输入所述非结构化文本数据,构建字典和搜索规则,以及气象要素实体抽取模型,均用于在所述非结构化文本数据中抽取气象要素实体,并生成气象要素实体集合;
步骤3,以时间和地点为主要对象构建气象要素实体关系分类模型,对所述气象要素实体进行关系分析,分别确定所述主要对象与最近天气词语之间的关系,同时根据预设规则,将特殊气象要素实体与对应的天气进行关联并输出关联结果;所述最近天气词语即主要对象与上下文中距离最近的天气词语;
步骤4,对输出的关联实体进行时间和单位的归一化换算,最终输出结构化格式的数据。
2.根据权利要求1中所述的一种基于实体关系抽取的结构化机场警报处理方法,其特征在于,所述步骤1包括:
步骤1-1,提取所述机场警报数据的有效信息,所述有效信息包括发布单位、发布时间和正文内容;
步骤1-2,建立停用词和停用符号库,根据所述停用词和停用符号库删除正文内容中与实体无关的字词、无意义的停用字和不必要的标点符号;将所述正文内容中以字母表示的单位修改为与字母对应的以汉字表示的单位;
步骤1-3,根据正则表达式构建处理规则,输出非结构化文本数据;所述处理规则用于在预处理后的正文内容中提取并移除部分警告内容,所述部分警告内容以预设起始词为起始,以预设结束词为结束。
3.根据权利要求1中所述的一种基于实体关系抽取的结构化机场警报处理方法,其特征在于,所述步骤2包括:
步骤2-1,若所述非结构化文本数据中包含能够通过规则进行气象要素抽取的气象要素实体,针对所述气象要素实体构建字典和搜索规则,在抽取所述气象要素后,生成气象要素实体集合;
步骤2-2,若所述非结构化文本数据中包含无法通过规则抽取的气象要素实体,通过构建气象要素实体抽取模型对所述气象要素实体进行气象要素抽取,对所述步骤1产生的非结构化文本数据进行标注并训练气象要素实体抽取模型。
4.根据权利要求3中所述的一种基于实体关系抽取的结构化机场警报处理方法,其特征在于,所述步骤2-1包括:
步骤2-1-1,获取搜索关键词,所述搜索关键词为包括机场名称、天气现象词和天气形容词中的一个或多个词语;
步骤2-1-2,根据所述搜索关键词构建字典,所述字典包括机场名称字典和天气现象字典,每个所述字典通过键值对表示;
步骤2-1-3,根据所述搜索关键词构建搜索规则:
根据所述搜索关键词搜索字典,抽取所述非结构化文本数据中出现的气象要素实体,所述气象要素实体包括机场名称、天气现象词和天气形容词;
其中,对抽取出的文本中位置相邻的天气现象词和天气形容词进行合并,形成一个气象要素实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110564234.9/1.html,转载请声明来源钻瓜专利网。