[发明专利]用于建立电网知识图谱的逻辑模型的方法及系统和介质有效
申请号: | 202011192637.7 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112364177B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 王继业;张帆;陈翔;张鹏宇;江鹏;张书健;陈思宇;史昕;李杏 | 申请(专利权)人: | 国家电网有限公司大数据中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q50/06 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 郭德霞 |
地址: | 100052 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 建立 电网 知识 图谱 逻辑 模型 方法 系统 介质 | ||
本发明提出一种用于建立用于电网知识图谱的逻辑模型的方法、系统及介质。方法包括:确定用于定义实体及其属性的实体模式;将第一数据源中的多个实体判定为完整实体或不完整实体;基于第一数据源按照实体模式生成所有完整实体和不完整实体的实体属性信息以生成逻辑模型的实体集;确定用于定义源实体和目标实体之间的关系的关系模式;对于第二数据源中的存在于该实体集中的源实体和目标实体,至少基于第二数据源按照关系模式生成相应的实体关系信息以生成逻辑模型的关系集;基于实体集和关系集建立包括实体、属性和关系的逻辑模型。利用本发明的方案,可以弥补现有模型的设计短板,给用户提供更合理的管控模型,并支持统一数据模型的信息匹配。
技术领域
本发明涉及知识图谱技术,更具体而言,涉及一种用于建立用于电网知识图谱的逻辑模型的方法及相应的系统和计算机可读存储介质。
背景技术
随着知识图谱技术的进一步发展,知识图谱以其强大的语义处理能力和知识组织能力为大规模知识库组织和智能化应用奠定了基础。知识图谱由大量实体和实体关联构成。通过知识图谱,可以检索地标、人名、城市、运动队、建筑物、地理特征、电影、天体、艺术作品等实体,并获取与这些实体相关的信息。这是构建智能应用的关键,它融入了网络的集体智慧,并且能更像人去理解世界。在具体的应用场合,需要基于特定领域本体库建设领域知识图谱,支撑面向特定领域的信息智能检索和领域智能应用建设。面向特定领域的知识图谱建设不仅需要通用知识,更侧重结合领域专业知识。领域知识图谱的建设需要支撑实际工程应用,相比通用知识图谱的建设在识别率、准确性等相关指标方面有更高的要求。为了满足面向领域的大规模知识库及智能应用建设,需要研究适应领域特征的信息抽取技术及领域知识图谱的构建方法。
近些年,国内推出了大量以中文为主语言的知识图谱,它们主要都是基于百度百科和维基百科的结构化信息构建起来的,旨在利用社区力量维护开放域知识图谱的Schema标准。知识图谱的构建方式包括人工编辑和自动抽取,但自动抽取方法主要是基于在线百科中的结构化信息而忽略了非结构化文本,而互联网中大部分的信息恰恰是以非结构化的自由文本形式呈现。在链接数据发展的同期,很多基于信息抽取技术的知识获取方法被提出,用以构建基于自由文本的开放域知识图谱。2007年,华盛顿大学Banko等人率先提出开放域信息抽取(OIE),直接从大规模自由文本中直接抽取实体关系三元组,即头实体、关系指示词以及尾实体三部分。在OIE提出之前,也有很多面向自由文本的信息抽取被提出,但这些方法主要的思路都是为每个目标关系训练相应的抽取器。这类传统的信息抽取方法在面对互联网文本中海量的关系类别时无法高效地工作,即为每个目标关系训练抽取器是不现实的,更为严重的是,很多情况下面对海量的网络文本我们无法事先明确关系的类型。
此外,当前基于企业级数据模型的知识资源分类、智能搜索、以及对于跨域的知识融合和表示尚处于起步阶段,缺乏面向相关管理人员、业务人员的直观通俗的模型界面,同时数据模型的逻辑链路搜索能力及静态语义分析评估能力也受到严重限制。诸如国家电网公司企业公共数据模型(SG-CIM)的数据模型作为公司企业级电网、资产、财务等方面数据的全面抽象,不仅数量庞大,而且涉及专业门类极多,使得在模型成果、应用和支撑三个方面仍存在以下问题:(1)模型设计质量仍需完善,即在目前模型设计成果中,仍存在部分数据对象抽象程度不一致、实体关系不准确、数据对象及属性不完整、去重不彻底、数据溯源不完整、标准编码与源端业务系统编码不对应等实际问题;(2)模型映射率不高,即各单位基于不同版本的物理模型进行映射比对,导致平均映射率较低;(3)缺乏工具支撑,即目前数据模型管控多采用线下方式,流程复杂、沟通效率低,且模型设计成果较为抽象,造成各级人员对模型难以理解,应用能力不足,模型应用与迭代完善质量无法保证。
因此,需要提供一种改进的技术方案,以克服现有数据模型中存在的缺陷。
发明内容
本发明的目的在于提供一种方案,以解决上述技术问题。
具体地,根据本发明的第一方面,提供一种用于建立用于电网知识图谱的逻辑模型的方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司大数据中心,未经国家电网有限公司大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011192637.7/2.html,转载请声明来源钻瓜专利网。