[发明专利]用于建立电网知识图谱的逻辑模型的方法及系统和介质有效
申请号: | 202011192637.7 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112364177B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 王继业;张帆;陈翔;张鹏宇;江鹏;张书健;陈思宇;史昕;李杏 | 申请(专利权)人: | 国家电网有限公司大数据中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q50/06 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 郭德霞 |
地址: | 100052 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 建立 电网 知识 图谱 逻辑 模型 方法 系统 介质 | ||
1.一种用于建立用于电网知识图谱的逻辑模型的方法,包括:
确定用于定义实体及其属性的实体模式,所述实体模式至少包括实体的实体名称和属性;
接收包括实体相关信息和属性相关信息的第一数据源,将所述第一数据源中的多个实体按以下基准判定为完整实体或不完整实体:对于所述多个实体中的每个实体,当所述第一数据源中不存在相应的属性相关信息时将该实体判定为完整实体,否则将该实体判定为不完整实体;
对于每个完整实体和每个不完整实体,基于所述第一数据源按照所述实体模式生成相应的实体属性信息,从而得到所述第一数据源包括的全部实体的实体属性信息集合,以生成包括所述实体属性信息集合的所述逻辑模型的实体集;
确定用于定义源实体和目标实体之间的关系的关系模式,所述关系模式至少包括源实体的实体名称和目标实体的实体名称;
接收包括源实体和目标实体之间的关系的关系相关信息的第二数据源,所述第二数据源包括多对源实体和目标实体,对于每对源实体和目标实体,基于该源实体的实体名称和该目标实体的实体名称判断该源实体和该目标实体是否存在于所述逻辑模型的实体集中,仅当判断结果为肯定时,基于所述第二数据源和所述逻辑模型的实体集按照所述关系模式生成该对源实体和目标实体的实体关系信息,从而得到所述第二数据源包括的全部关系的实体关系信息集合,以生成包括所述实体关系信息集合的所述逻辑模型的关系集;
基于所述逻辑模型的实体集和所述逻辑模型的关系集,建立包括实体、属性和关系的逻辑模型。
2.根据权利要求1所述的方法,实体模式所包括的属性基于所述第一数据源中的属性相关信息按照预定义的属性模式确定,所述属性模式至少包括属性的属性名称和属性数据类型。
3.根据权利要求2所述的方法,其中,对于每个完整实体和每个不完整实体,基于所述第一数据源按照所述实体模式生成相应的实体属性信息包括:
对于每个完整实体,基于所述第一数据源中的实体相关信息和属性相关信息,对该完整实体的实体名称以及相应的属性的属性名称和属性数据类型进行规范化处理,并至少基于规范化处理的实体名称以及相应的属性名称和属性数据类型按照所述实体模式和所述属性模式生成相应的实体属性信息;
对于每个不完整实体,基于所述第一数据源中的实体相关信息,对该不完整实体的实体名称进行规范化处理,并至少基于规范化处理的实体名称按照所述实体模式生成相应的实体属性信息。
4.根据权利要求1所述的方法,其中,基于所述第二数据源和所述逻辑模型的实体集按照所述关系模式生成一对源实体和目标实体的实体关系信息包括:
对所述第二数据源进行解析以获得表示该源实体和该目标实体之间的关系的第一标签,所述第一标签至少指示该源实体的实体类型和该目标实体的实体类型;
仅当所述第一标签指示该源实体的实体类型和该目标实体的实体类型为类时,基于该源实体的实体名称和该目标实体的实体名称以及所述逻辑模型的实体集按照所述关系模式对该源实体和该目标实体进行信息补全;
从所述第二数据源获取第二标签,基于所述第二标签对该源实体和该目标实体之间的关系的关系类型进行细化;
基于所述第一标签、补全的信息和被细化的关系类型按照所述关系模式生成该对源实体和目标实体的实体关系信息。
5.根据权利要求1至4中任一项所述的方法,所述实体模式还包括实体的主题域、二级主题域、实体描述;所述属性模式还包括属性的属性描述;所述关系模式还包括源实体与目标实体之间的关系的关系方向、关系类型、多重性和角色。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司大数据中心,未经国家电网有限公司大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011192637.7/1.html,转载请声明来源钻瓜专利网。