[发明专利]一种电网知识图谱构建方法及装置在审
申请号: | 202010972672.4 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112100402A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 杨朝谊;刘晔;肖建毅;黄晓波 | 申请(专利权)人: | 广东电力信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F16/28;G06F16/25 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨小红 |
地址: | 510060 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电网 知识 图谱 构建 方法 装置 | ||
本申请提供的一种电网知识图谱构建方法及装置,其中方法包括:按照预设的电网知识图谱体系模板,通过命名实体识别方式和文本提取方式,从预设的关系数据库中获取与电网知识图谱体系模板相应的电网特征数据;建立电网特征数据与关系数据库的映射关系;按照映射关系,从关系数据库中提取与电网特征数据对应的实例数据,将实例数据进行数据转换并存储至图谱数据库,以获得电网知识图谱。本申请基于预设的电网知识图谱体系模板,针对性获取与电网知识图谱体系模板相应的电网特征数据,并以获取到的电网特征数据与关系数据库的映射关系,构建电网知识图谱,解决了知识图谱构建方式在针对特定领域构建知识图谱存在的准确性低的技术问题。
技术领域
本申请涉及大数据领域,尤其涉及一种电网知识图谱构建方法及装置。
背景技术
近年来,知识图谱正在成为实现多源异构超媒体数据融合的一种关键技术。知识图谱本质上是一种语义网络,图中的结点代表实体或者概念,边代表实体/概念之间的各种语义关系。基于知识图谱技术的本体建模,本质上是为多源、异构、类型多样的大数据提供了一种高抽象概念层次的统一数据模型。基于这样一个数据模型,通过一组图谱生成工具把各种来源、异构、海量的大数据进行汇聚、融合、以及关联在一起进行存储。基于知识图谱的大数据分析,实现了大数据的本质语义关联,比传统的关系型数据库更加自由多样化,能够更好地满足用户对电网大数据的价值探索和情报发现需求。
目前,已有的知识图谱都是根据开放通用知识图谱构建的,具体为通过从网络文本中自动提取、识别命名实体和进行知识融合,从而构建出相应的知识图谱,但在现有模式下存在,针对特定领域构建的知识图谱准确性低的技术问题。
发明内容
本申请提供了一种电网知识图谱构建方法及装置,用于解决现有的知识图谱构建方式在针对特定领域构建知识图谱存在的准确性低的技术问题。
本申请第一方面提供了一种电网知识图谱构建方法,包括:
按照预设的电网知识图谱体系模板,通过命名实体识别方式和文本提取方式,从预设的关系数据库中获取与所述电网知识图谱体系模板相应的电网特征数据,其中所述电网特征数据包括:命名实体对象,所述命名实体对象的对象属性以及命名实体对象之间的关联关系;
建立所述电网特征数据与所述关系数据库的映射关系;
按照所述映射关系,从所述关系数据库中提取与所述电网特征数据对应的实例数据,将所述实例数据进行数据转换并存储至图谱数据库,以获得电网知识图谱。
优选地,所述建立所述电网特征数据与所述关系数据库的映射关系具体包括:
将所述命名实体对象和所述关联关系与所述关联数据库中的目标数据表建立映射关系,其中所述目标数据表具体为与所述命名实体对象对应的数据表;
将所述对象属性与所述目标数据表的字段建立映射关系。
优选地,所述按照所述映射关系,从所述关系数据库中提取与所述电网特征数据对应的实例数据,将所述实例数据进行数据转换并存储至图谱数据库,以获得电网知识图谱具体包括:
按照所述映射关系,从所述关系数据库中提取与所述电网特征数据对应的实例数据,利用Apache NiFi将所述实例数据进行数据转换并存储至图谱数据库,以获得电网知识图谱。
优选地,所述命名实体对象具体包括:人员对象、单位对象、项目对象以及项目产出对象。
优选地,还包括:
根据所述对象属性,建立与所述对象属性对应的索引信息。
本申请第二方面提供了一种电网知识图谱构建装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电力信息科技有限公司,未经广东电力信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010972672.4/2.html,转载请声明来源钻瓜专利网。