[发明专利]一种用于知识图谱的噪音检测及知识完成的方法和设备在审

专利信息
申请号: 202110021632.6 申请日: 2021-01-08
公开(公告)号: CN112732931A 公开(公告)日: 2021-04-30
发明(设计)人: 赵翔;谭真;邵天阳;李硕豪;郭得科;肖卫东;张军 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/28
代理公司: 长沙大珂知识产权代理事务所(普通合伙) 43236 代理人: 伍志祥
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 知识 图谱 噪音 检测 完成 方法 设备
【说明书】:

发明公开了一种用于知识图谱的噪音检测并生成知识完成的方法和设备,包括以下步骤:获取含有噪音的知识图谱的数据;基于翻译框架将实体和关系投影到低维空间;引入实体类型层次信息和关系路径信息;计算三元组中实体和关系的匹配度;计算该匹配度的可信度;综合匹配度和可信度计算三元组评分。本发明方法设计了一个融合结构信息、实体类型层次信息和关系路径信息的知识图谱噪音检测及知识完成基本框架;利用实体类型层次信息和关系路径信息即知识图谱的辅助信息,分两步对一个三元组是否为真进行判断,以检测出知识图谱中存在的噪声并生成更好的知识表示。

技术领域

本发明属于知识图谱数据处理领域,具体涉及一种用于知识图谱的噪音检测及知识完成的方法和设备。

背景技术

知识图谱(Knowledge Graph,KG)已经被广泛地应用于现实世界中,例如,知识驱动的人工智能和问题回答系统等。一个典型的知识图谱通常包含大量的三元组来存储知识,其形式是(头实体,关系,尾实体),可以简写为(h,r,t)。近年来,在现实世界中有很多被广泛使用的知识图谱,如Freebase、WikiData、WordNet等不同领域的知识图谱。尽管我们现在还不能做到对于现实世界中知识的全覆盖,但必须保持知识图谱的更新以反映现实世界的变化,这对知识驱动的应用至关重要。传统的构建知识图谱的方法需要专家监督或者人工标注,耗时且效率低下。最近,自动神经关系提取、众包机制被广泛应用于知识图谱的构建,但由于缺乏人工监督,这些方法构建的知识图通常含有噪声。许多工作已经证实了知识图中存在噪声和错误,这将影响结果的质量。

知识图构建的基本问题之一是知识完成学习。相关研究人员已经提出了许多知识完成学习的方法,但大多数传统的方法都假设知识图中没有噪声,这显然不符合实际情况。如果忽略知识图中的噪声,实体和关系的表示将会出现错误,从而对下游任务造成负面影响。因此,考虑知识图中的噪声非常重要。最近,谢等人提出了三元组置信度来应对知识图片中的噪声问题,并同时构建知识完成。它根据局部和全局的结构信息来估计三元组的置信度得分,判断三元组是否可信。三元组置信度由三部分组成,其对每一个三元组给出一个得分。但是,该三重置信度估计器只考虑了内部结构的信息,没有考虑辅助信息,导致模型的鲁棒性较低。此外,它的三重置信估计器包含很多参数,这意味着需要大量的资源来寻找合适的参数。

发明内容

有鉴于此,本发明的目的在于提出了一种基于三元组差异度和三元组支持度的知识表征学习框架(DSKRL),以学习知识表征。它不仅考虑了结构信息和辅助信息,而且减少了参数的数量。图1是本发明的DSKRL模型的简要工作过程,自动构建知识图后,知识图中既有知识又有噪声。在构建知识表征的过程中,噪声有望被我们的模型检测到,并将其影响降到最低。同时,也完成了知识完成。

基于上述目的,本发明第一方面提供一种用于知识图谱的噪音检测及知识完成的方法,包括以下步骤:

步骤1,获取含有噪音的知识图谱的数据;

步骤2,基于翻译框架将实体和关系投影到低维空间;

步骤3,引入实体类型层次信息和关系路径信息;

步骤4,计算三元组中实体和关系的匹配度;

步骤5,计算所述匹配度的可信度;

步骤6,综合所述匹配度和所述可信度计算三元组评分;

所述的知识图谱表示为,G=(E,R,T),其中E代表实体,R代表关系,代表图谱中的三元组。

进一步的,所述的步骤2中利用基于翻译的框架,将所述实体E和所述关系R投影到一个连续且低维的空间中;

步骤3中引入实体类型层次信息和关系路径信息,所述实体类型层次信息为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110021632.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top