[发明专利]一种知识图谱实体对齐方法及装置有效
申请号: | 202111095446.3 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114036307B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 曾开胜;李涓子;侯磊;冯铃;唐杰;许斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张亚超 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 实体 对齐 方法 装置 | ||
本发明提供一种知识图谱实体对齐方法及装置,包括:获取待融合的两个知识图谱的数据;分别对两个知识图谱的数据进行邻域聚合的实体表示学习,得到两个知识图谱中各实体的实体表示;根据实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示;根据实体表示进行概念与概念层次体系表示学习,对实体与概念、概念与概念之间的关系进行建模,得到概念与概念层次体系表示;通过实体关系表示、概念与概念层次体系表示对实体表示在基于向量距离的实体对齐过程中进行约束,得到两个知识图谱实体对齐的结果。将概念与概念层次体系融合进实体对齐框架并使其发挥作用,提高实体对齐的准确率。
技术领域
本发明涉及计算机人工智能自然语言处理领域,尤其涉及一种知识图谱实体对齐方法及装置。
背景技术
融合多语言、多知识源信息的知识图谱已经成为信息抽取、智能问答等众多人工智能应用的重要知识来源。为了更高效地融合信息存在重合和互补的知识图谱,实体对齐吸引了众多学者的兴趣而成为一项重要的研究问题。许多知识图谱为不同的应用提供了丰富的结构化知识,这些知识图谱由于具有不尽相同的构造目的,知识之间存在很大的异构性,同时也会包含一些互补知识。为了更好的支持上层的跨语言问答系统、跨语言推荐系统等任务,融合不同的知识图谱成为一个重要的研究方向。其中,实体对齐就是知识图谱融合的一项关键技术。
传统的知识图谱实体对齐方法,主要利用实体文本信息、实体属性信息、实体网络结构信息等,计算一系列相似度,然后通过人为设定的阈值,或是机器学习中的分类算法,来实现对给定实体对是否为等价实体的判定,因此在实体对齐任务的过程中会发生属于不同概念的实体对齐的错误情况,影响实体对齐的准确性。
发明内容
本发明提供一种知识图谱实体对齐方法及装置,用以解决现有技术中知识图谱中实体对齐准确性低缺陷,实现在概念的约束下,属于同一概念下的实体进行对齐,提高实体对齐的准确性。
本发明提供一种知识图谱实体对齐方法,包括:
获取待融合的两个知识图谱的数据;
分别对两个所述知识图谱的数据进行邻域聚合的实体表示学习,得到两个所述知识图谱中各实体的实体表示;
根据所述实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示;
根据所述实体表示进行概念与概念层次体系表示学习,对实体与概念、概念与概念之间的关系进行建模,得到概念与概念层次体系表示;
通过实体关系表示、概念与概念层次体系表示对实体表示在基于向量距离的实体对齐过程中进行约束,得到两个所述知识图谱实体对齐的结果。
根据本发明提供的一种知识图谱实体对齐方法,两个所述知识图谱的数据为头实体、尾实体以及两个实体之间关系的关系型三元组集合;所述分别对两个所述知识图谱的数据进行邻域聚合的实体表示学习,得到两个所述知识图谱中各实体的实体表示,具体包括:
应用注意力图神经网络对两个所述知识图谱的各实体进行编码,实体ei在第l+1层网络的向量表示为其计算方式为:
其中,是第l层网络的权重,实体初始向量来自实体表示矩阵d是向量表示的维数,σ(.)是非线性激活函数,是第l层网络中实体ei和ej间的注意力权重;
应用两个矩阵分别对头实体及尾实体进行线性变换来计算注意力系数
其中,为两个线性变换的参数矩阵,(.)T为矩阵转置操作,LeakyReLU(.)为非线性激活函数;
通过将实体ei与其邻居实体的注意力系数进行规范化,可以得到实体间注意力权重
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095446.3/2.html,转载请声明来源钻瓜专利网。