[发明专利]一种空管领域知识图谱的自动化构建方法在审
申请号: | 202011015419.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112182241A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 韩云祥;张建伟;谭世成 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/84;G06F16/951 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 领域 知识 图谱 自动化 构建 方法 | ||
1.一种空管领域知识图谱的自动化构建方法,其特征在于,包括:
步骤1:构建空管领域本体,采用自顶向下的方式构建空管领域知识图谱;
步骤2:建立空管领域多源数据集,包含结构化空管数据、半结构化空管数据和非结构化空管数据;
步骤3:根据步骤2中建立的空管数据,通过知识抽取技术进行实体、关系、属性的抽取;
步骤4:根据步骤3抽取的知识,通过共指消解手段进行知识融合,形成全局统一的RDF类型的知识;
步骤5:将步骤4得到的格式化的RDF知识导入图数据库Neo4j中,用于自动搭建空管领域知识图谱。
2.根据权利要求1所述的一种空管领域知识图谱的自动化构建方法,其特征在于,步骤1构建空管领域本体,所述方法包括定义空管领域本体框架、抽取空管领域概念、定义概念之间的关系、审查本体、形成本体。
3.根据权利要求1所述的一种空管领域知识图谱的自动化构建方法,其特征在于,步骤1中利用Protege建模工具将定义的本体持久化保存。
4.根据权利要求1所述的一种空管领域知识图谱的自动化构建方法,其特征在于,步骤2中采用MySQL存储空管结构化数据,使用HTML文件保存半结构化数据,采用爬虫爬取互联网中的非结构化航空数据,非结构化文本数据保存在文本文档中。
5.根据权利要求1所述的一种空管领域知识图谱的自动化构建方法,其特征在于,步骤3中采用RDB2RDF映射语言将数据库中存储的结构化数据映射为RDF三元组数据。
6.根据权利要求1所述的一种空管领域知识图谱的自动化构建方法,其特征在于,步骤3中采用构建包装器的方法抽取保存在HTML中的半结构化数据。
7.根据权利要求1所述的一种空管领域知识图谱的自动构建方法,其特征在于,步骤3中采用基于深度学习的方法抽取非结构化数据中的实体、关系。
8.根据权利要求1所述的一种空管领域知识图谱的自动构建方法,其特征在于,步骤4中采用聚类的方法进行共指消解从而达到知识融合目的。
9.根据权利要求1所述的一种空管领域知识图谱的自动构建方法,其特征在于,步骤5中采用Neo4j图数据库对知识图谱进行持久化存储,通过构建RDF2Neo4j解释器,将RDF三元组数据导入Neo4j图数据库中进行存储。
10.一种空管领域知识图谱的自动化构建方法,其特征在于,包含:
本体构建模块:用于建立空管领域本体;
数据收集模块:用于建立空管领域的结构化、半结构化和非结构化文本的知识数据集;
知识抽取模块:用于根据步骤3中建立的知识数据集,获取知识数据集中包含的实体及这些实体对应的关系,建立空管领域的RDF三元组知识数据集;
知识融合模块:用于根据步骤3抽取的知识,进行知识融合,形成全局统一的知识;
知识存储模块:用于根据步骤5中得到的全局统一的知识数据导入图数据库中,用于自动搭建空管领域知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011015419.6/1.html,转载请声明来源钻瓜专利网。