[发明专利]一种基于电网全业务数据的电力知识图谱构建方法在审
申请号: | 202010191662.7 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111552813A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 李继红 | 申请(专利权)人: | 国网浙江省电力有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/247;G06F40/289;G06Q50/06 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
地址: | 310000*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电网 业务 数据 电力 知识 图谱 构建 方法 | ||
1.一种基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述电力知识图谱构建方法,包括:
将电网全业务数据转换为RDF模型;
对RDF模型中的数据进行类型划分,基于划分后的选取含义相近的词组;
将选出的词组按实体属性不同构建知识三元组;
根据三元组构建电力知识图谱。
2.根据权利要求1所述的基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述将电网全业务数据转换为RDF模型,包括:
将表示电网全业务数据的结构化数据映射成为RDF模型;
其中,结构化数据保存在关系型数据库中,将关系型数据库的表描述为一个类,列描述为属性,行描述为实体,单元格的值描述为属性值。
3.根据权利要求1所述的基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述对RDF模型中的数据进行类型划分,基于划分后的选取含义相近的词组,包括:
采用隐马尔科夫模型对文本的每句话分词,计算分词后词向量的相似度;
基于词向量相似度数值大小,对符合阈值范围内的实体词进行筛选,基于筛选结果进行对象匹配。
4.根据权利要求1所述的基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述采用隐马尔科夫模型对文本的每句话分词,包括:
将每个分词与中的类、属性、实体词进行匹配,计算两个词向量Vi,Vj的余弦相似度Sim(Vi,Vj)和词性相似度Set(Vi,Vj),
其中表示Vi的等级,Dist(Vi,Vj)表示Vi和Vj在等级树中的距离,设定阈值x1、x2判断两词在存储结构上的相似度。
5.根据权利要求4所述的基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述基于词向量相似度数值大小,对符合阈值范围内的实体词进行筛选,基于筛选结果进行对象匹配,包括:
如果Set(Vi,Vj)<x1或Sim(Vi,Vj)<x2,则认为两词具有相似的词义或词性,将所有符合阈值范围的实体词按相似度排序,该分词匹配到相近的类、属性、实体词。
6.根据权利要求1所述的基于电网全业务数据的电力知识图谱构建方法,其特征在于,所述将选出的词组按实体属性不同构建知识三元组,包括:
统计两个不同实体相组合、一个实体和一个属性相组合的所有可能情况,其中两个实体或一个实体和一个属性作为两个已知元素e、r;
计算每一个其它实体与已知元素e,r匹配成三元组的概率h(e,r),
其中Wc为被测试元素的向量矩阵,bp表示射影偏差,De和Dr是k×k维的对角矩阵,分别表示实体和关系权重,bc表示关联偏差;
设置阈值y,若存在h(e,r)>y的情况,选择其中最大元素的与e、r构成三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司,未经国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191662.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:监控摄像头管理方法、装置、终端及存储介质
- 下一篇:一种模块热水器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置