[发明专利]实体处理方法、装置和存储介质有效

专利信息
申请号: 201811290669.3 申请日: 2018-10-31
公开(公告)号: CN109684625B 公开(公告)日: 2021-01-12
发明(设计)人: 方舟;冯知凡;李双婕;徐也;梁海金;张扬;陆超;朱勇 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/36
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 荣甜甜;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 处理 方法 装置 存储 介质
【说明书】:

发明提供一种实体处理方法、装置和存储介质,该方法包括:对知识图谱中的目标实体进行分组,获取多个实体组,每个实体组中包括多个目标实体对;获取每个实体组的每个目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组;在多个新的实体组中获取待建边客体的关联实体,并将待建边客体与关联实体进行关联;待建边客体为待建边的三元组中的客体,待建边客体的关联实体为:与待建边客体的相似度大于相似度阈值的目标实体。本发明在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。

技术领域

本发明涉及数据处理技术领域,尤其涉及一种实体处理方法、装置和存储介质。

背景技术

知识图谱(Knowledge Graph)又称为科学知识图谱。知识图谱在无论是学术界还是工业界都有着举足轻重的地位,它是人工智能的基础,也是实现智能问答等应用的必经之路,能够快捷方便地为用户提供信息。知识图谱中包括多个结构化实体,即大量主谓宾三元组(SPO)的集合,S即subject,P即predict,O即object。对实体的处理一般包括:实体融合、实体建边;实体融合指的是对新实体进行收录归一,即将新实体与知识图谱中的实体匹配,将新实体与知识图谱中匹配的实体进行合并;实体建边是指对SPO中的O进行实体消歧,在知识图谱中找到对应的相同概念的实体。

现有技术中,对实体进行处理的两个步骤之间没有建立联系,即二者是孤立分开处理的,不能对实体进行有效的处理,且现有技术中对实体的融合只是根据实体名称和别名的方式进行匹配,融合的准确性低。

发明内容

本发明提供一种实体处理方法、装置和存储介质,在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。

本发明的第一方面提供一种实体处理方法,包括:

对知识图谱中的目标实体进行分组,获取多个实体组,每个所述实体组中包括多个目标实体对,所述实体组中的一个所述目标实体对是由所述实体组中一个目标实体与其他目标实体组成的;

获取每个所述实体组的每个所述目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组,每个所述新的实体组中不包含相似度大于相似度阈值的目标实体;

在多个所述新的实体组中获取待建边客体的关联实体,并将所述待建边客体与所述关联实体进行关联;所述待建边客体为所述待建边的主谓宾三元组中的客体,所述待建边客体的关联实体为:在所述新的实体组中,与所述待建边客体的相似度大于所述相似度阈值的目标实体。

可选的,所述对知识图谱中的目标实体进行分组,获取多个实体组之前,包括:

根据所述知识图谱中的每个实体的语义,获取所述目标实体。

可选的,所述获取每个所述实体组的每个所述目标实体对中的两个目标实体的相似度,包括:

采用预设的属性比较方法和属性重要度,获取每个所述目标实体对中两个目标实体之间的属性相似度;

采用预设的迭代模型,对所述属性相似度进行迭代计算,获取每个所述目标实体对中的两个目标实体的相似度。

可选的,采用预设的属性比较方法和属性重要度,获取每个所述目标实体对中两个目标实体之间的属性相似度,包括:

根据所述属性重要度中的比较信息,确定每个所述目标实体对中两个目标实体之间的多个待比较属性对;

根据每个所述待比较属性对的特征,从所述预设的属性比较方法中选取对应的比较方法进行属性对比较,获取每个所述目标实体对中两个目标实体之间的属性相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811290669.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top