[发明专利]电力基建知识图谱构建方法在审
申请号: | 202111096719.6 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113946684A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 范荣全;赵星俨;舒俊霖;赵晓芳;黄剑波;刘俊勇;杨昌建;杨江平;刘有波;唐杨;张智 | 申请(专利权)人: | 国网四川省电力公司;国网四川省电力公司眉山供电公司;四川大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/126;G06F40/295;G06N3/04 |
代理公司: | 成都时誉知识产权代理事务所(普通合伙) 51250 | 代理人: | 何悦 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 基建 知识 图谱 构建 方法 | ||
本发明公开了电力基建知识图谱构建方法,包括如下步骤:获取原始数据,通过数据获取模块获取文档、表格及新闻的原始数据;数据预处理,将获取得到的原始数据进行预处理,分别得到结构化数据与非结构化数据的预处理后的数据;知识抽取,对结构化数据,进行知识抽取得到三元组;对非结构化数据,首先采用BiLSTM‑CRF进行命名实体识别,将命名实体识别后的非结构化数据采用BERT模型进行实体关系抽取;将知识抽取得到的知识进行知识融合,得到实体‑关系‑实体的三元组,获得实体‑关系‑实体的三元组后,进行知识表示,形成知识图谱,并存储于Neo4j图数据库中。
技术领域
本发明涉及电力基建与知识图谱领域,具体是电力基建知识图谱构建方法。
背景技术
现代电力网络能够迅速发展的一个重要原因即是电力基建的发展。随着电力网络规模的不断扩大,越来越多的物联网、人工智能等技术被引入电力基建中,电力基建包含大量的人机料法环信息,基建过程中的新设备、新方法也让电力基建过程变得更加复杂。在这种情况下,电力基建的业务将面临越来越大的挑战。电力基建过程中存在大量的多源异构数据,管理类别众多且繁杂,管理效率低下。
知识图谱是一种语义网,它以结构化的形式表示事物以及事物之间的关系,可以有效利用大量的结构化、半结构化和非结构化数据。知识图谱的构建包括知识抽取、知识融合与知识表示等。知识图谱分为通用知识图谱和领域知识图谱。通用知识图谱主要应用于搜索引擎;领域知识图谱主要应用于特定的领域,专业化程度更高,已在医疗、法律、金融、电商等领域有应用。
领域知识图谱构建的一个关键挑战是缺乏领域内的数据集且专业术语和概念较多。传统的基于规则或基于模板的知识抽取需要人工构建大量的规则模板,适用范围有限,难以适应复杂的需求。
因此,构建知识图谱,减少人工的精力消耗,实现自动化地从原始数据中获取知识,并以Neo4j图数据库进行可视化存储是十分有必要的。
发明内容
本发明的目的在于克服现有技术的不足,提供电力基建知识图谱构建方法,包括如下步骤:
步骤一,获取原始数据,通过数据获取模块获取文档、表格及新闻的原始数据;
步骤二,数据预处理,将获取得到的原始数据进行预处理,分别得到结构化数据与非结构化数据的预处理后的数据;
步骤三,知识抽取,对结构化数据,进行知识抽取得到三元组;对非结构化数据,首先采用BiLSTM-CRF进行命名实体识别,将命名实体识别后的非结构化数据采用BERT模型进行实体关系抽取;
步骤四,将知识抽取得到的知识进行知识融合,得到实体-关系-实体的三元组,获得实体-关系-实体的三元组后,进行知识表示,形成知识图谱,并存储于Neo4j图数据库中。
进一步的,所述的将获取得到的原始数据进行预处理,分别得到结构化数据与非结构化数据的预处理后的数据,包括如下过程,对非结构化数据,将不同格式的数据转化为Txt文本格式,并进行分词处理;对存储于传统关系型数据库中的结构化数据,把对应字段映射为知识图谱中的实体与关系。
进一步的,所述的对非结构化数据,首先采用BiLSTM-CRF进行命名实体识别,将命名实体识别后的非结构化数据采用BERT模型进行关系抽取,包括如下过程:
通过词嵌入算法将单词序列转化为向量形式,得到词向量Vword=(v1,v2,v3,…,vn),其中n为向量维度;将文本进行编码,然后解码获得每个词的序列标签,使用双向长短期记忆神经网络进行命名实体识别,再结合条件随机场对双向长短期记忆神经网络的输出进行约束,从样本中识别出实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网四川省电力公司;国网四川省电力公司眉山供电公司;四川大学,未经国网四川省电力公司;国网四川省电力公司眉山供电公司;四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096719.6/2.html,转载请声明来源钻瓜专利网。