[发明专利]基于知识图谱的火电厂多源数据融合方法与装置在审

专利信息
申请号: 201910984801.9 申请日: 2019-10-16
公开(公告)号: CN110781249A 公开(公告)日: 2020-02-11
发明(设计)人: 蒋蓬勃;白帆;李友志;王继强;苏涛;卢意;苏京彬;宋峰 申请(专利权)人: 华电国际电力股份有限公司技术服务分公司;华电莱州发电有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F40/295;G06F40/242;G06F40/247;G06Q50/06
代理公司: 37297 济南宝宸专利代理事务所(普通合伙) 代理人: 荆向勇
地址: 250000 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图谱 多源数据 构建 知识库 数据处理领域 数据融合技术 领域知识 难点问题 行业应用 行业知识 有效整合 融合 分散式 火电厂 火电 电厂 更新 申请
【权利要求书】:

1.一种基于知识图谱的火电厂多源数据融合方法,其特征在于:包括以下步骤:

步骤S101,根据火电厂设备编码的标准化体系以及通用的数据标准建立知识图谱的基础架构,知识图谱在逻辑上分为模式层与数据层,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储;

步骤S102,将基础架构中的各个实体之间的关系进行统一规范,得到具有标准规范的标准化字典表;

步骤S103,获取与知识图谱中的内容相关的结构化数据:从包括火电厂设备特性数据、故障数据、维修数据等数据信息和故障原因及处理方法、值长日志等管理信息,以及设备运行状态,过程参数,设备性能的数据中,根据知识图谱中定义的内容,从这些数据集中抽取相关的结构化数据;

步骤S104,从结构化数据中抽取关键实体的实体信息;在步骤S103获取的火电厂数据的基础上,从结构化数据中抽取生产运行相关的关键实体,与知识图谱中的标准字典表中的概念和属性进行映射,做到实体排齐;

步骤S105,根据知识图谱中的标准字典表将不同来源数据中所蕴含的实体和属性信息进行融合,最终形成一致且规范的结构化数据;

步骤S106,基于结构化数据生成对应的三元组数据对,并将三元组数据对存储为知识图谱。将三元组数据存储到Neo4j图形数据库。三元组数据对是节点、关系以及属性组成,通过这个三元组可以完整地描述任意一个实体的情况。同时,还可以在关系上赋予属性,灵活扩展知识图谱的网络模型。

2.如权利要求1所述的基于知识图谱的火电厂多源数据融合方法,其特征在于,所述的步骤S102中,统一规范具体是指将实体的实体属性转换成三元组数据RDF,根据三元组数据RDF将实体属性与实体的关系类型和命名规则进行统一规范。

3.如权利要求1所述的基于知识图谱的火电厂多源数据融合方法,其特征在于,所述的步骤S105采取如下步骤实现:

步骤S105-1,判断数据中蕴含的实体、属性及关系是否和标准规范中所定义的相一致:如果实体、属性及关系中存在着较为明显的不一致,则执行步骤S105-2,依赖标准字典表将实体信息进行数据融合,形成结构化数据;

步骤S105-2,根据知识图谱的规范定义对实体名称、实体属性、实体关系进行映射,在映射的基础上进行融合,形成最终规范的结构化数据;具体的:将实体名称与标准字典表中的内容进行映射,得到同义的实体名称,最终确定一个同义实体名;将同义的实体、名称、属性及关系进行数据融合,形成结构化数据;

步骤S105-3,对于与规范标准不一致的其他实体、属性及关系,那么将采用提交给人工,进行审核编辑的方法,通过人的专业知识来消除异构和不一致的情况,最终实现不同数据源和知识图谱之间的一致性。

4.如权利要求1所述的基于知识图谱的火电厂多源数据融合装置,其特征在于,包括

知识图谱基础架构建立模块10,用于根据通用数据标准建立知识图谱的基础架构;

标准字典表生成模块20,用于将基础架构中的各个实体之间的关系进行统一规范,得到具有标准规范的标准字典表;

多源数据获取模块30,用于获取与知识图谱中的内容相关的结构化数据;

数据实体抽取模块40,基于知识图谱的定义,用于从结构化数据中抽取关键实体的实体信息;

多源数据融合模块50,用于根据知识图谱及标准字典表将实体名称、属性及关系进行数据融合,形成结构化数据;

三元组数据存储模块60,用于将三元组数据对存储到Neo4J图数据库中。

5.如权利要求4所述的基于知识图谱的火电厂多源数据融合装置,其特征在于,所述的标准字典表生成模块20包括:

三元组数据结构转换单元21,用于将实体的属性、关系转换成三元组数据RDF;

三元组数据统一定义单元22,用于根据RDF将实体属性与实体的关系类型和命名规则进行统一规范。

6.如权利要求4所述的基于知识图谱的火电厂多源数据融合装置,其特征在于,所述的源数据融合模块50,包括

判断单元51,用于判断实体信息是否符合标准规范;

数据融合单元52,用于在符合标准规范的情况下,根据标准字典表将实体信息进行数据融合,形成三元组数据对。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华电国际电力股份有限公司技术服务分公司;华电莱州发电有限公司,未经华电国际电力股份有限公司技术服务分公司;华电莱州发电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910984801.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top