[发明专利]知识图谱的构建方法及装置、电子设备在审
申请号: | 202110331430.1 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112905808A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 张虎;刘同林;贾鹏;胡丽;张高科;王凌;董昆;史聪莉;张进 | 申请(专利权)人: | 北京机电工程研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/34;G06F40/295;G06F40/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 100074 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 电子设备 | ||
本发明提供了知识图谱的构建方法及装置、电子设备,该方法包括:确定当前原始数据的至少一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息;根据每一条原始数据中的至少一个第一三元组信息和每至少一个第二三元组信息,生成待构建知识图谱的本体库并生成待构建知识图谱;当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;根据至少一个新增第一三元组信息和至少一个新增第二三元组信息,更新本体库;根据更新后的本体库,更新待构建知识图谱。本方案能够提高知识图谱构建的智能化程度。
技术领域
本发明涉及计算机技术领域,特别涉及知识图谱的构建方法及装置、电子设备。
背景技术
随着大数据时代的到来,知识图谱应运而生。知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及他们之间的相互联系,在工业领域得到了广泛应用。
现有的知识图谱一般通过数据采集、数据处理和数据库重构、知识转化和实战应用五个步骤,运用分布式存储、关联算法、语义推理等技术,再基于实体的属性联系、时空联系、语义联系、特征联系等建立相互的关系,即可构建一张多维多层的实体与实体、实体与事件的知识图谱。然而,现有技术的知识图谱构建的智能化程度较低。
发明内容
本发明实施例提供了知识图谱的构建方法及装置、电子设备,可以提高知识图谱构建的智能化程度。
第一方面,本发明实施例提供了知识图谱的构建方法,该方法包括:
从原始数据库中获取至少一条原始数据;
针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;
根据每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;
根据所述知识图谱的模式层和所述知识图谱的数据层,生成待构建知识图谱的本体库;
根据所述待构建知识图谱的本体库,生成待构建知识图谱;
当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;
根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库;
根据更新后的所述本体库,更新所述待构建知识图谱。
优选地,
所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;
所述针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据中的至少一个第一三元组信息包括:
D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;
D2:将所述结构化原始数据确定为一个所述第一三元组信息;
D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;
D4:解析所述当前原始数据;
D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京机电工程研究所,未经北京机电工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110331430.1/2.html,转载请声明来源钻瓜专利网。