[发明专利]一种基于剪枝子图的知识图谱表示方法在审
申请号: | 202210483527.9 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114780750A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 刘文杰;姚俊飞 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N3/08 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 陈天林 |
地址: | 210044 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 剪枝 知识 图谱 表示 方法 | ||
本发明提供一种基于剪枝子图的知识图谱表示方法,涉及知识图谱领域。该发明基于剪枝子图的知识图谱表示方法,包括:采用TransE模型学习三元组(eh,r,et)的结构化信息,得到实体特征向量矩阵和关系特征向量矩阵;通过计算三元组中的头实体和关系的距离得到关系传播系数,得到一个ne×ne邻接权重矩阵;根据邻接权重矩阵,对所有目标实体的k阶邻域实体由里向外呈线性扩展进行有选择地采样,形成剪枝子图;通过将剪枝子图和GAT进行结合来聚合邻居剪枝子图特征信息;解决了以下问题:GAT的注意力机制仅基于一阶邻域的实体的特征信息,没有考虑高阶邻域实体特征信息。当GAT使用更高阶的邻域(间接邻居实体)来进行训练时,会出现过度平滑,造成知识图谱表示性能下降。
技术领域
本发明涉及知识图谱领域,具体为一种基于剪枝子图的知识图谱表示方法。
背景技术
知识图谱(knowledge graph,KG)是一种语义网络,它由实体和关系组成,通过三元组(eh,r,et)的方式进行表示。自从KG被提出以后,已经有不少的大型KG被构建出来,比较典型的有WordNet、知立方、知心等。这些大型的KG极大方便了人们对知识的查找。然而,由于大型KG采用了三元组(eh,r,et)的方式表示知识,导致计算起来较为复杂,给知识检索、知识推理、自动问答等下游任务带来了一定的麻烦。因此,近年来学者们将注意力转向了知识表示学习,希望通过知识表示学习来解决KG面临的问题。知识表示学习的目标,是在保存知识图谱中的关键信息的前提下,将知识图谱中的实体和关系都表示为稠密的低维实值向量,以便深度学习对其进行下一步的处理。
最近,图注意力网络GAT(Graph Attention Network)作为一种新的在图数据上进行深度学习的方法,成为研究者们关注的一个新的热点。GAT在多项图数据的处理任务中取得了当前最好的性能。受此激发,有一些研究工作开始尝试利用GAT来对知识图谱进行表示学习。GAT将实体当作节点,将关系当作边来构造一个图来进行图运算。然而,用GAT来进行知识图谱表示主要存在两个问题:(1)GAT中的注意力主要基于实体内容之间的相似度计算,即GAT仅考虑实体的一阶邻域,而高阶邻域实体在很大程度上仍然没有被使用。(2)当GAT使用更高阶的邻域(间接邻居实体)来进行训练时,GAT的性能骤然下降。GAT表示学习性能下降的原因,很大程度上是由GAT本身存在的过平滑性(over-smoothing)造成的。
因此,我们提出一种基于剪枝子图的知识图谱表示方法,以便于解决上述中提出的问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于剪枝子图采样的知识图谱表示方法,解决以下问题:(1)GAT的注意力机制仅基于一阶邻域的实体的特征信息,没有考虑高阶邻域实体特征信息。(2)当GAT使用更高阶的邻域(间接邻居实体)来进行训练时,会出现过度平滑,造成知识图谱表示性能下降。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于剪枝子图的知识图谱表示方法,包括以下步骤:
步骤一:采用TransE模型学习三元组(eh,r,et)的结构化信息,得到实体特征向量矩阵和关系特征向量矩阵
步骤二:所述知识图谱为有向图,信息由头实体传播到尾实体,通过计算三元组中的头实体特征向量和关系特征向量之间的距离得到关系传播系数,得到一个ne×ne邻接权重矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210483527.9/2.html,转载请声明来源钻瓜专利网。