[发明专利]一种工程领域知识图谱构建方法及其生成装置在审

专利信息
申请号: 201911196101.X 申请日: 2019-11-29
公开(公告)号: CN111090683A 公开(公告)日: 2020-05-01
发明(设计)人: 张静;杜续;苏辉;许丽萍;杨石飞;雷丹 申请(专利权)人: 上海勘察设计研究院(集团)有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/28;G06F16/23
代理公司: 上海申蒙商标专利代理有限公司 31214 代理人: 黄明凯
地址: 200093*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 工程 领域 知识 图谱 构建 方法 及其 生成 装置
【说明书】:

发明公开了一种工程领域知识图谱构建方法及其生成装置,构建方法包括以下步骤:构建应用于工程领域的知识图谱的本体层,包括本体、本体属性以及本体关系;建立标准数据表,采集结构化信息;基于数据库实现知识融合;实体之间的实体关系继承实体所对应的本体之间的本体关系。本发明的优点是:通过标准数据表定向联动数据库,实现数据的实时更新与可追溯,通过数据库的唯一性设置提高知识清洗的速度和准确度,基于本体对工程领域实体进行自动抽提,能极大地提高工程领域知识图谱的构建效率和质量。

技术领域

本发明属于知识图谱技术领域,具体涉及一种工程领域知识图谱构建方法及其生成装置。

背景技术

知识图谱是真实世界中存在的各种实体或概念及其关系,随着信息技术的飞速发展,数据量呈爆炸式增长,知识图谱对数据进行提炼、萃取、关联、整合,真正挖掘大数据的深层价值;

知识图谱可分通用知识图谱与领域知识图谱(又称垂直知识图谱),前者是以互联网开放数据为基础,对知识抽取的质量有一定的容忍度,领域知识图谱以领域或企业内部的数据为主要来源,知识抽取质量要求很高,较多的依靠从企业内部的结构化、非结构化以及半结构化数据进行联合抽取,并依靠人工进行审核校验,保证质量,其中工程领域具有风险高、危害大等特点,对知识准确性的要求尤为严格;

知识资源是工程企业等知识密集型企业的核心资源,工程企业的竞争优势不在于它的固定资产,而在于它所拥有的人力资本和知识资本。工程领域传统知识库管理一般采用文档模式,实际使用效率低,知识规模小,知识图谱将知识文档进行结构化处理,快速调取单独知识点,而不是包含知识点的文档,能够更好的对海量知识进行归类、索引,同时具有良好的可扩展性,可快速构建大规模知识库,知识规模上的量变将带来知识效用的质变。

综上,工程领域传统知识管理陈旧难用,无形中增加了知识积累的门槛,亟需基于知识图谱技术填补工程领域智能知识库空白,同时如何建立高质量的工程领域知识图谱亟待解决。

发明内容

本发明的目的是根据上述现有技术的不足之处,提供一种工程领域知识图谱构建方法及其生成装置,该构建方法通过构建应用于工程领域的知识图谱本体层,建立标准数据表,采集结构化信息,基于数据库实现知识融合,依据本体及本体关系建立实体及实体关系,解决现有工程领域知识库管理不利于知识积累,难以有效用于应用程序以及有效地进行数据推理的问题。

本发明目的实现由以下技术方案完成:

一种工程领域知识图谱构建方法,其特征在于所述构建方法包括以下步骤:

S1:构建应用于工程领域的知识图谱的本体层,包括本体、本体属性以及本体关系;

S2:建立标准数据表,采集结构化信息;

S3:基于数据库实现知识融合;

S4:实体之间的实体关系继承实体所对应的本体之间的本体关系;

S5:将本体、本体属性和本体关系以及实体、实体属性和实体关系存入图数据库中,遍历所述图数据库将具有相同实体名称且实体属性完全相同的实体进行合并;

S6:所述图数据库的数据更新。

步骤S2包括以下步骤:建立标准数据表,所述标准数据表具有固定格式;根据所述标准数据表的固定格式,从来源于办公文档、文本、图片、图纸、报表中的半结构化数据和非结构化数据中提取相应的文字或数值并填入所述标准数据表中;所述标准数据表定向存储于所述数据库中并定向联动,所述标准数据表中的数据发生内容修改时,所述数据库中的数据也将同步更新。

步骤S3包括以下步骤:

所述数据库中预设有不可冗余数据设计表单,所述不可冗余数据设计表单确定各数据字段的唯一性,所述数据字段由单个或多个字段联合组成;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海勘察设计研究院(集团)有限公司,未经上海勘察设计研究院(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911196101.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top