[发明专利]基于路径邻域聚合和难负样本挖掘的关系推理方法在审
申请号: | 202310592502.7 | 申请日: | 2023-05-23 |
公开(公告)号: | CN116578638A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张勇东;毛震东;靳国庆;郭俊波;李家昂 | 申请(专利权)人: | 人民网股份有限公司;中国科学技术大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/28;G06F18/214;G06F18/22;G06N3/0464;G06N3/08 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 谢中用 |
地址: | 100733 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 路径 邻域 聚合 样本 挖掘 关系 推理 方法 | ||
本发明涉及知识图谱技术领域,公开了一种基于路径邻域聚合和难负样本挖掘的关系推理方法,包括邻域编码、负样本筛选,路径选择和路径‑邻域聚合。在邻域编码中,本发明设计了邻域编码器,自动编码实体一跳内邻域关系,获得实体自身的表示;在负样本筛选中,本发明用单个实体表示,设计了一种获取难负样本的办法;在路径选择中,本发明基于待预测关系两端的实体对表示,选择出与待预测关系关联度最高的路径表示;最终在路径‑邻域聚合中,本发明设计了一种聚合方法以利用路径表示和实体对表示,实现归纳式关系推理。
技术领域
本发明涉及知识图谱技术领域,具体涉及一种基于路径邻域聚合和难负样本挖掘的关系推理方法。
背景技术
知识图谱是由实体作为节点、不同类型的关系作为边构成的有向图,知识图谱中的每条边都是形如(头实体-关系-尾实体)的三元组。知识图谱以结构化的形式储存自然世界中的知识,常被用于知识问答、阅读理解等自然语言处理任务中。
由于不完整的、新的实体不断被添加到知识图谱中,因此目前的研究工作基于归纳式关系推理的思路提出了各种方法,以在兼容新实体的前提下预测缺失的关系。这些方法大致可以分为两种途径:
第一种途径,从知识图谱中挖掘实体间的一阶逻辑规则,并使用规则的加权组合进行推理;
第二种途径,先将实体间的路径聚合到一张子图中,再通过深度学习的方法获得子图表示,用于关系推理。
然而,现有的两种途径都只考虑了实体之间的联系,没有注意到每个实体自身的邻域信息对关系推理的影响。事实上,实体的邻域包含实体间联系所不具备的很多信息。图2展示了归纳式关系推理的一个例子,可以看到,要推理虚线所示的待预测关系(谁是头实体的队友)时,关系两端的头实体和尾实体邻域信息会对推理起到积极的帮助。具体来说,尾实体邻域中,尾实体与“球队选中”这类关系相连,暗含该实体可能表示一名运动员,从而使得待预测关系成立的可能性更高。另外,现有的方法在进行负样本采样时采用的都是随机采样的策略,例如图2中一些地名可能被采样为“队友”的负样本,很容易被区分,而其他作为人名的实体可以构成更难区分的负样本,从而提供更高质量的数据。
发明内容
为解决上述技术问题,本发明提供一种基于路径邻域聚合和难负样本挖掘的关系推理方法。
为解决上述技术问题,本发明采用如下技术方案:
一种基于路径邻域聚合和难负样本挖掘的关系推理方法,通过归纳式关系推理模型,对包含新实体的知识图谱中的任意两个实体之间存在的各类关系的概率进行预测,具体包括以下步骤:
步骤一,邻域编码:将两层Transformer网络与池化层拼接作为邻域编码器,将每个实体i的关系集合的向量表示输入至邻域编码器,得到实体i的实体表示ei;其中T为每个实体的关系类别数量;根据待预测关系两端实体ei,ej的实体表示创建实体对表示pairij,ej为实体j的实体表示;i≤N,N为知识图谱中的实体总量,为与实体i相连的第t类关系的向量表示,的取值范围为{r1,…,rs,…,rS},rs为知识图谱中第s类关系的向量表示,S为知识图谱中关系类别总量;
步骤二,负样本筛选:基于实体表示,通过计算余弦相似度的方式,为每个实体筛选出匹配的负样本实体集合;对于数据集中每一个三元组形式的正样本,将正样本中的实体替换为匹配的负样本实体集合中的实体,从而构造出三元组形式的难负样本;
步骤三,路径选择:将待预测关系两端实体之间的路径转换为路径特征表示计算路径特征表示与实体对表示pairij之间的相似度,选择相似度最高的前l条路径的路径特征表示组成路径特征集合{pij}l;k≤K,K为待预测关系两端实体之间的路径总数,l为设定值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民网股份有限公司;中国科学技术大学,未经人民网股份有限公司;中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310592502.7/2.html,转载请声明来源钻瓜专利网。