[发明专利]一种基于电网全业务数据的电力知识图谱构建方法在审
申请号: | 202010191662.7 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111552813A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 李继红 | 申请(专利权)人: | 国网浙江省电力有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/247;G06F40/289;G06Q50/06 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
地址: | 310000*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电网 业务 数据 电力 知识 图谱 构建 方法 | ||
本申请实施例提出了一种基于电网全业务数据的电力知识图谱构建方法,包括将电网全业务数据转换为RDF模型;对RDF模型中的数据进行类型划分,基于划分后的选取含义相近的词组;将选出的词组按实体属性不同构建知识三元组;根据三元组构建电力知识图谱。借助知识图谱技术,实现业务数据的跨业务贯通,并提供网格化的高速检索和深度挖掘功能,提升企业管理的规范化、标准化、精益化水平。
技术领域
本发明属于数据库管理领域,尤其涉及一种基于电网全业务数据的电力知识图谱构建方法。
背景技术
全业务统一数据中心是全业务、全类型、全时间维度数据的汇集中心,是为公司各类分析决策类应用提供完备的数据资源、高效的分析计算能力及统一的运行环境,改变过去分析型应用数据反复抽取、冗余存储的局面,实现“搬数据”向“搬计算”的转变,支撑企业级数据分析应用的全面开展。
目前全业务统一数据中心中通过主数据管理,统一编码管理等方式进行了数据贯通和数据管理,但是对于历史数据的梳理和贯通却收效胜微,缺乏有效的保障措施,难以确保数据贯通的持续有效。
发明内容
为了解决现有技术中存在的缺点和不足,本发明提出了一种基于电网全业务数据的电力知识图谱构建方法,借助知识图谱技术,实现业务数据的跨业务贯通,并提供网格化的高速检索和深度挖掘功能,提升企业管理的规范化、标准化、精益化水平。
具体的,所述电力知识图谱构建方法,包括:
将电网全业务数据转换为RDF模型,
对RDF模型中的数据进行类型划分,基于划分后的选取含义相近的词组;
将选出的词组按实体属性不同构建知识三元组;
根据三元组构建电力知识图谱。
可选的,所述将电网全业务数据转换为RDF模型,包括:
将表示电网全业务数据的结构化数据映射成为RDF模型。
其中,结构化数据保存在关系型数据库中,将关系型数据库的表描述为一个类,列描述为属性,行描述为实体,单元格的值描述为属性值。
可选的,所述对RDF模型中的数据进行类型划分,基于划分后的选取含义相近的词组,包括:
采用隐马尔科夫模型对文本的每句话分词,计算分词后词向量的相似度;
基于词向量相似度数值大小,对符合阈值范围内的实体词进行筛选,基于筛选结果进行对象匹配。
可选的,所述采用隐马尔科夫模型对文本的每句话分词,包括:
将每个分词与中的类、属性、实体词进行匹配,计算两个词向量Vi,Vj的余弦相似度Sim(Vi,Vj)和词性相似度Set(Vi,Vj),
其中depthVi表示Vi的等级,Dist(Vi,Vj)表示Vi和Vj在等级树中的距离,设定阈值x1、x2判断两词在存储结构上的相似度。
可选的,所述基于词向量相似度数值大小,对符合阈值范围内的实体词进行筛选,基于筛选结果进行对象匹配,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司,未经国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191662.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:监控摄像头管理方法、装置、终端及存储介质
- 下一篇:一种模块热水器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置