[发明专利]知识图谱实体领域冲突检测方法、装置及相关设备有效
申请号: | 202010626024.3 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111831830B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 陈沛;荆宁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 实体 领域 冲突 检测 方法 装置 相关 设备 | ||
本公开实施例提供了一种知识图谱实体领域冲突检测方法及装置、电子设备和存储介质。该方法包括:获取知识图谱的领域树;获取知识图谱中的当前实体;获得当前实体在领域树中所属的第一领域及第二领域;分别确定第一领域及第二领域在领域树中的位置;根据第一领域及第二领域在领域树中的位置,确定当前实体的第一领域及第二领域的关系;确定第一领域及第二领域在领域树中不存在公共子领域,或者,确定第一领域及第二领域在领域树中存在公共父领域且公共父领域为通用领域,将第一领域及第二领域确定为可疑冲突领域对;根据可疑冲突领域对,获得知识图谱的冲突领域对。该方法可以得到知识图谱中存在的冲突领域对,覆盖率很高。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种知识图谱实体领域冲突检测方法及装置、电子设备和计算机可读存储介质。
背景技术
在知识图谱构建中,需要对互联网质量不一、类别不明的数据进行分类,以添加知识领域信息。
相关技术中,对实体分类可以通过规则或者算法模型实现,但泛化能力有限,可能会出现分类错误的情况,导致一个实体被分类到互相冲突的领域,例如,“86版西游记”被同时分类到“电视剧”和“名著”领域。
因此,需要一种新的知识图谱实体领域冲突检测方法及装置、电子设备和计算机可读存储介质。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开实施例提供一种知识图谱实体领域冲突检测方法及装置、电子设备和计算机可读存储介质,该方法可以知识图谱中存在的冲突领域对,覆盖率很高。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供一种知识图谱实体领域冲突检测方法,该方法包括:获取知识图谱的领域树;获取知识图谱中的当前实体;获得当前实体在领域树中所属的第一领域及第二领域;分别确定第一领域及第二领域在领域树中的位置;根据第一领域及第二领域在领域树中的位置,确定当前实体的第一领域及第二领域的关系;确定第一领域及第二领域在领域树中不存在公共子领域,或者,确定第一领域及第二领域在领域树中存在公共父领域且公共父领域为通用领域,将第一领域及第二领域确定为可疑冲突领域对;根据可疑冲突领域对,获得知识图谱的冲突领域对。
本公开实施例提供一种知识图谱实体分类方法,该方法包括:利用上述知识图谱实体领域冲突检测方法获得知识图谱的冲突领域对;获取待分类实体;获取待分类实体在领域树中所属的第三领域及第四领域;根据冲突领域对,从第三领域及第四领域中确定待分类实体的目标领域。
本公开实施例提供一种知识图谱实体融合方法,该方法包括:利用上述知识图谱实体领域冲突检测方法获得知识图谱的冲突领域对;获取第一实体和第二实体;获得第一实体在领域树中所属的第五领域,及第二实体在领域树中所属的第六领域;确定第五领域和第六领域属于冲突领域对,不融合第一实体和第二实体。
本公开实施例提供一种冲突检测方法,该方法包括:获取树形结构;获取当前实体;获得当前实体在树形结构中所属的第一元素及第二元素;根据第一元素及第二元素在树形结构中的位置关系,将第一元素及第二元素确定为冲突对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010626024.3/2.html,转载请声明来源钻瓜专利网。