[发明专利]一种知识图谱实体对齐方法及装置有效
申请号: | 202111095446.3 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114036307B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 曾开胜;李涓子;侯磊;冯铃;唐杰;许斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张亚超 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 实体 对齐 方法 装置 | ||
1.一种知识图谱实体对齐方法,其特征在于,包括:
获取待融合的两个知识图谱的数据;
分别对两个所述知识图谱的数据进行邻域聚合的实体表示学习,得到两个所述知识图谱中各实体的实体表示;
根据所述实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示;
根据所述实体表示进行概念与概念层次体系表示学习,对实体与概念、概念与概念之间的关系进行建模,得到概念与概念层次体系表示;
通过实体关系表示、概念与概念层次体系表示对实体表示在基于向量距离的实体对齐过程中进行约束,得到两个所述知识图谱实体对齐的结果。
2.根据权利要求1所述的知识图谱实体对齐方法,其特征在于,两个所述知识图谱的数据为头实体、尾实体以及两个实体之间关系的关系型三元组集合;所述分别对两个所述知识图谱的数据进行邻域聚合的实体表示学习,得到两个所述知识图谱中各实体的实体表示,具体包括:
应用注意力图神经网络对两个所述知识图谱的各实体进行编码,实体ei在第l+1层网络的向量表示为其计算方式为:
其中,是第l层网络的权重,实体初始向量来自实体表示矩阵d是向量表示的维数,σ(.)是非线性激活函数,是第l层网络中实体ei和ej间的注意力权重;
应用两个矩阵分别对头实体及尾实体进行线性变换来计算注意力系数
其中,为两个线性变换的参数矩阵,为矩阵转置操作,LeakyReLU(.)为非线性激活函数;
通过将实体ei与其邻居实体的注意力系数进行规范化,可以得到实体间注意力权重
经过L层图卷积网络,得到实体ei融合领域实体信息的向量表示H(L)为邻域聚合的实体表示矩阵。
3.根据权利要求2所述的知识图谱实体对齐方法,其特征在于,根据所述实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示,具体包括:
通过知识表示平移模型TransE将实体和关系表示到同一个向量空间,为每一个关系型三元组(eh,r,et)∈T计算一个合理性得分:
其中,eh及et表示两个实体,r表示实体eh及实体et之间的关系;
应用基于间隔排序的损失函数作为知识表示平移模型TransE的优化目标OR:
其中,实体eh和et的向量表示取自邻域聚合的实体表示矩阵H(L),关系r的向量表示取自需要学习得到的关系矩阵γ20是间隔超参数,训练负样本集合T′由关系型三元组集合T进行类型负采样得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095446.3/1.html,转载请声明来源钻瓜专利网。