[发明专利]一种电力系统的知识图谱构建方法及系统在审
申请号: | 201910931486.3 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110727741A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 刘广一;韩海韵;汤亚宸;张华敏;刘婷婷 | 申请(专利权)人: | 全球能源互联网研究院有限公司;国网山西省电力公司;国家电网有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06Q50/06 |
代理公司: | 11250 北京三聚阳光知识产权代理有限公司 | 代理人: | 张琳琳 |
地址: | 102209 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力系统 关系型数据库 全局图 三元组 图模型 构建 融合 图谱构建 相似度 模型输入 潜在知识 数据结构 业务部门 复杂度 图谱 数据库 节约 应用 统一 | ||
本发明公开了一种电力系统的知识图谱构建方法及系统,构建方法包括:获取电力系统各业务部门的关系型数据库;分别构建各关系型数据库的图模型;基于图模型分别构建各关系型数据库的知识三元组集;根据节点及对应属性值的相似度,将各关系型数据库对应的图模型进行融合,形成全局图模型;根据知识三元组集中实体包含的节点及对应属性值的相似度,对全局图模型中的知识三元组集进行融合,形成融合后的全局图模型;将融合后的全局图模型输入图数据库中形成电力系统的知识图谱。本发明充分利用了现有电力系统的数据结构与潜在知识连接,将各类应用的知识进行统一表达,节约了大量的人力投入,大幅降低电力系统知识图谱构建的难度和复杂度。
技术领域
本发明涉及电力技术领域,具体涉及一种电力系统的知识图谱构建方法及系统。
背景技术
随着泛在电力物联网的不断建设和发展,电网日常监管运行所产生的数据规模已超过亿级并持续增长,传统的关系型数据库和一般的统计查询功能已不能高效、便捷、灵活地分析数据间内在的关系和潜在的知识。知识图谱是有效解决电力系统海量知识挖掘分析的重要技术手段之一。通过构建面向电力系统的知识图谱,能融合电力系统中海量的结构化数据,形成知识库,并可以将数据间潜在或者缺失的关联关系显性地展示,提供统一的知识搜索分析接口,实现海量知识及其内在关联关系的实时动态分析,支撑数据资产价值的挖掘。
构建领域专用的知识图通常运用自顶向下的策略,现在技术提供的方法都需大量的人工介入方法来确定顶层的实体关系,难以解决以下问题:第一,由于电力系统知识专业性强且涉及范围广,需要投入大量人员完成知识的整合工作,费时费力;第二,电力领域内知识点众多,缺乏兼具各类电力知识的全面型专业人员,难以实现知识的准确高效融合。因此,电力系统构建一套小规模万级知识图谱时,工程造价很高,更难以构造出大规模复杂的电力领域内知识图谱。
发明内容
因此,本发明提供一种电力系统的知识图谱构建方法及系统,克服了现有技术中难以构造大规模复杂的电力系统的知识图谱的不足。
第一方面,本发明实施例提供一种电力系统的知识图谱构建方法,包括:获取电力系统各业务部门的关系型数据库;分别构建各关系型数据库的图模型,所述图模型表征各关系型数据库包含的节点间关联关系;基于所述图模型分别构建各关系型数据库的知识三元组集,所述知识三元组表征各关系型数据库包含的实体间关联关系;根据节点及对应属性值的柑似度,将各关系型数据库对应的图模型进行融合,形成全局图模型;根据知识三元组集中实体包含的节点及对应属性值的相似度,对全局图模型中的知识三元组集进行融合,形成融合后的全局图模型;将融合后的全局图模型输入图数据库中,形成电力系统的知识图谱。
在一实施例中,分别构建各关系型数据库的图模型的步骤,包括:分析各关系型数据库的数据库表结构,获取主键和外键信息;将数据库表转换为节点及其属性的信息,以及将外键转换为边及其属性的信息;利用节点及其属性和边及其属性的信息,将数据库表之间通过外键关联的方式转换为“第一节点-边-第二节点”的三元组模型。
在一实施例中,所述基于所述图模型分别构建各关系型数据库的知识三元组集的步骤,包括:将数据表中数据的主键作为对应数据的第一实体的名称;将数据表中数据的外键作为实体之间的关系名称,并将外键对应的另一数据表的主键作为对应数据的第二实体名称;分别构建各关系型数据库的“第一实体-关系-第二实体”的知识三元组。
在一实施例中,所述根据节点及对应属性值的相似度,将各关系型数据库对应的图模型进行融合,形成全局图模型的步骤,包括:获取第一图模型和第二图模型中的节点名称和属性名称,分别组成矩阵第一矩阵和第二矩阵;将第一矩阵和第二矩阵中的元素进行词向量的相似度计算,得到第一矩阵和第二矩阵中的共指度指数矩阵;将共指度指数矩阵中的共指度指数超过预设阈值的同一对类型数据进行融合,将其中一个类型数据的名称作为融合后的名称,形成全局图模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;国网山西省电力公司;国家电网有限公司,未经全球能源互联网研究院有限公司;国网山西省电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910931486.3/2.html,转载请声明来源钻瓜专利网。