[发明专利]一种基于事实上下文的知识图谱补全方法及系统有效
| 申请号: | 202110643541.6 | 申请日: | 2021-06-09 |
| 公开(公告)号: | CN113360670B | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 史玉良;陈尚志;王继虎;陈志勇;李晖 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/38;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250101 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 事实 上下文 知识 图谱 方法 系统 | ||
本发明提供了一种基于事实上下文的知识图谱补全方法及系统,包括事实信息编码和事实信息融合,事实信息编码的目标是得到事实的向量表示,首先通过门控循环单元来捕获事实中头实体、关系、尾实体的序列依赖,随后利用卷积神经网络来对门控循环单元的输出进行特征提取,从而得到事实的整体向量表示;事实信息融合的目标是将事实信息编码得到的事实特征向量与该事实下的头实体、关系、尾实体各自的特征向量进行融合,通过评分函数对融合事实信息后的实体和关系进行计算,实现知识图谱的补全。本发明能够提高模型在知识图谱补全任务的性能。
技术领域
本发明属于大数据信息处理技术领域,具体涉及一种基于事实上下文的知识图谱补全方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
知识图谱是一种结构化的语义知识库,它通过符号形式描述客观世界中的概念及其相互关系。知识图谱通常由一系列事实的构成,这些事实又称为知识。在静态知识图谱中事实被构建成(头实体,关系,尾实体)形式的三元组,在时间知识图谱中事实通常被构建成(头实体,关系,尾实体,时间)形式的四元组。
目前,知识图谱在知识问答、智能推荐等众多场景中得到了广泛应用,是人工智能领域中的重要研究内容。由于大部分现有的知识图谱是通过人工或半自动的方式从网络资源中提取数据而构建的,因此在构建过程中无法完整和全面地将现实世界中的所有事实加入到知识图谱中。尽管知识图谱在持续不断的扩充新的内容,现有的知识图谱仍然存在着稀疏性和不完整性的问题。据统计,Freebase中有71%的人类实体缺失出生地信息,DBpedia中有58%的科学家实体缺失研究方向的信息。这些稀疏性和不完整性的问题将会影响知识图谱在各个应用场景下的实际效果,因此知识图谱补全成为学术界和工业界的研究热点。
知识图谱补全旨在找到现实世界中应该存在但在知识图谱中缺失的事实,提高知识图谱的完整性。现有的知识图谱补全方法主要是通过将知识图谱中的实体和关系嵌入到低维稠密向量空间中,并通过计算实体和关系在向量空间中的距离或相似度来判断它们之间是否存在一定联系,从而实现知识图谱补全。然而,现有方法存在着一些不足:一方面,它们主要关注在实体和关系本身而未考虑事实上下文,无法更好地学习到实体和关系在不同事实下的语义信息;另一方面,负采样是知识图谱补全过程中重要步骤,现有的负采样策略主要通过随机替换事实中的头实体或尾实体的方式来生成负样本,这往往会导致所生成的负样本质量不高,影响知识图谱补全的效果。
发明内容
本发明为了解决上述问题,提出了一种基于事实上下文的知识图谱补全方法及系统,本发明能够保证模型每次训练迭代过程都能够有一定的反馈,提高模型在知识图谱补全任务的性能。
根据一些实施例,本发明采用如下技术方案:
一种基于事实上下文的知识图谱补全方法,包括以下步骤:
对知识图谱中的实体、关系进行编码处理和嵌入表示,获得实体和关系的表示向量;
利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征,得到事实的正向和反向嵌入向量表示;
对事实的正向和反向的嵌入向量表示进行特征融合,最终得到事实的整体嵌入向量表示;
基于深度神经网络对事实整体的嵌入向量表示和当前事实下的实体和关系进行特征融合,使实体和关系映射到对应的事实空间中;
基于深度神经网络构造事实评估模型,通过预训练后的事实评估模型生成与正样本保持近似语义的负样本,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本;
构造基于空间距离的评分函数和激活函数的评分函数,通过计算头实体、关系、尾实体的嵌入向量表示的对应的空间距离以及激活函数输出数值来判断由当前实体和关系构成的事实的合理性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110643541.6/2.html,转载请声明来源钻瓜专利网。





