[发明专利]一种基于图卷积神经网络的电力业务系统数据对齐方法在审
| 申请号: | 202211606845.6 | 申请日: | 2022-12-14 |
| 公开(公告)号: | CN115935941A | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 蔡宇翔;蒋鑫;付婷;倪文书;王川丰;杨启帆 | 申请(专利权)人: | 国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司 |
| 主分类号: | G06F40/189 | 分类号: | G06F40/189;G06F16/36;G06F18/22;G06N3/08;G06N3/0464 |
| 代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 李晓芬 |
| 地址: | 350003 福*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图卷 神经网络 电力 业务 系统 数据 对齐 方法 | ||
本发明涉及一种基于图卷积神经网络的电力业务系统数据对齐方法,包括:对设备台账信息数据进行清洗、预处理;根据实体及实体间的关系构建知识图谱,获取知识图谱间预对齐的实体对;将知识图谱输入图自注意力卷积神经网络进行训练,将实体对作为对齐种子,作为图自注意力卷积神经网络的监督信息;通过图自注意力卷积神经网络得到各节点的嵌入向量表示,计算知识图谱间各节点的相似性,将最相似的两个节点作为对齐节点;根据对齐节点对待对齐电力业务系统实体的属性数据进行改写。本发明通过训练好的网络实体对齐模型,关联不同业务系统等价实体,预测多个电力业务系统中指向真实世界中的同一对象的数据的对应情况,保障不同数据源数据的可靠性。
技术领域
本发明涉及一种基于图卷积神经网络的电力业务系统数据对齐方法,属于电力业务数据处理技术领域。
背景技术
电力行业的深化改革要求电力企业进一步搞好信息化建设,进而更大程度实现信息互联和资源共享,使电力企业实现对数据资源的有效管理,充分挖掘数据资源的价值,实现降本增益的目标,从而进一步拓展行业空间。
但是,在运用电力业务系统过程中,不同业务部门对设备信息的记录数据会存在不一致的情况,并且随着时间增长,电力网络数据日益复杂,数据在不同电力业务系统上传播时频繁复制、修改,导致不同业务系统中数据的可靠性降低。这时需要对不同业务系统中表示同一设备的信息进行修改,保证数据的可靠性与一致性。
发明内容
为了克服上述问题,本发明提供一种基于图卷积神经网络的电力业务系统数据对齐方法,该方法通过训练好的网络实体对齐模型,关联不同业务系统等价实体,预测多个电力业务系统中指向真实世界中的同一对象的数据的对应情况,保障不同数据源数据的可靠性。
本发明的技术方案如下:
一种基于图卷积神经网络的电力业务系统数据对齐方法,包括:
获取两待对齐电力业务系统的设备台账信息数据,对所述设备台账信息数据进行清洗、预处理;
分别获取各电力业务系统中的实体及所述实体间的关系,根据所述实体及所述实体间的关系构建知识图谱,获取两所述知识图谱间预对齐的实体对,其中,所述实体为所述知识图谱的节点,所述实体间的关系为所述知识图谱的边;
将所述知识图谱输入图自注意力卷积神经网络进行训练,将所述实体对作为对齐种子,作为所述图自注意力卷积神经网络训练时的监督信息;
通过所述图自注意力卷积神经网络得到各所述节点的嵌入向量表示,计算所述知识图谱间各节点的相似性,将最相似的两个节点作为对齐节点;
根据对齐节点对待对齐电力业务系统实体的属性数据进行改写。
进一步的,对所述设备台账信息数据进行清洗、预处理,具体为剔除所述设备台账信息数据中损坏的数据,将剩余的数据处理为CSV格式。
进一步,根据所述实体及所述实体间的关系构建知识图谱,获取两所述知识图谱间预对齐的实体对,具体为:
提取知识图谱的节点,具体为将所述设备台账信息数据中用于区分实体的属性作为所述知识图谱的节点,将所述实体的文本信息字段作为所述节点的文本特征;
通过语言模型提取所述文本特征的语义信息,得到节点的嵌入向量表示;
根据所述实体间的关系构造所述节点的边;
得到两待对齐的知识图谱Gk:
Gk={Ek,Rk,Tk};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司,未经国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211606845.6/2.html,转载请声明来源钻瓜专利网。





