[发明专利]实体处理方法、装置和存储介质有效

专利信息
申请号: 201811290669.3 申请日: 2018-10-31
公开(公告)号: CN109684625B 公开(公告)日: 2021-01-12
发明(设计)人: 方舟;冯知凡;李双婕;徐也;梁海金;张扬;陆超;朱勇 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/36
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 荣甜甜;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 处理 方法 装置 存储 介质
【权利要求书】:

1.一种实体处理方法,其特征在于,包括:

对知识图谱中的目标实体进行分组,获取多个实体组,每个所述实体组中包括多个目标实体对,所述实体组中的一个所述目标实体对是由所述实体组中一个目标实体与其他目标实体组成的;

获取每个所述实体组的每个所述目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组,每个所述新的实体组中不包含相似度大于相似度阈值的目标实体;在对相似度大于相似度阈值的两个目标实体进行融合时,若该两个目标实体包括相同的第一属性,则该两个目标实体融合后的新的目标实体的属性包括:该两个目标实体中对应的文档的更新时间最新的目标实体的第一属性;

在多个所述新的实体组中获取待建边客体的关联实体,并将所述待建边客体与所述关联实体进行关联;所述待建边客体为所述待建边的主谓宾三元组中的客体,所述待建边客体的关联实体为:在所述新的实体组中,与所述待建边客体的相似度大于所述相似度阈值的目标实体。

2.根据权利要求1所述的方法,其特征在于,所述对知识图谱中的目标实体进行分组,获取多个实体组之前,包括:

根据所述知识图谱中的每个实体的语义,获取所述目标实体。

3.根据权利要求1或2所述的方法,其特征在于,所述获取每个所述实体组的每个所述目标实体对中的两个目标实体的相似度,包括:

采用预设的属性比较方法和属性重要度,获取每个所述目标实体对中两个目标实体之间的属性相似度;

采用预设的迭代模型,对所述属性相似度进行迭代计算,获取每个所述目标实体对中的两个目标实体的相似度。

4.根据权利要求3所述的方法,其特征在于,采用预设的属性比较方法和属性重要度,获取每个所述目标实体对中两个目标实体之间的属性相似度,包括:

根据所述属性重要度中的比较信息,确定每个所述目标实体对中两个目标实体之间的多个待比较属性对;

根据每个所述待比较属性对的特征,从所述预设的属性比较方法中选取对应的比较方法进行属性对比较,获取每个所述目标实体对中两个目标实体之间的属性相似度。

5.根据权利要求4所述的方法,其特征在于,所述在多个所述新的实体组中获取待建边客体的关联实体,包括:

若在所述新的实体组中存在目标实体为所述待建边客体的预设关联实体时,将所述目标实体作为所述关联实体;和/或,

若在所述新的实体组中存在目标实体的名称与所述待建边客体的名称相同、或者存在目标实体与建边实体具有共现关系、或者存在目标实体的类型与所述待建边客体的类型相同时,将所述目标实体作为所述关联实体;和/或,

在所述新的实体组中,获取每个所述待建边客体的多个候选目标实体;

获取每个所述待建边客体与每个候选目标实体的相似度,将最大相似度对应的候选目标实体作为候选关联实体;

若所述待建边客体对应的实体存在于所述知识图谱中时,将所述候选关联实体确定为所述关联实体。

6.根据权利要求5所述的方法,其特征在于,所述获取每个所述待建边客体与每个候选目标实体的相似度,包括:

获取每个所述候选目标实体对应的对特征和组特征,所述对特征为衡量所述待建边客体与所述候选目标实体之间的相似性的特征,所述组特征为衡量包括所述待建边的客体的三元组与所述候选目标实体之间的相似性的特征。

7.根据权利要求6所述的方法,其特征在于,所述若所述待建边客体对应的实体存在于所述知识图谱中时,将所述候选关联实体确定为所述关联实体之前,还包括:

确定所述候选关联实体是否与所述待建边的实体存在冲突;

若否,判断所述待建边客体对应的实体是否存在于所述知识图谱中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811290669.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top