[发明专利]一种基于图神经网络的互联网食品实体对齐方法及系统有效
申请号: | 202110604291.5 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113342809B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 左敏;薛明慧;张青川;颜文婧 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28;G06F16/951;G06N3/048;G06N3/082 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 金怡 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 互联网 食品 实体 对齐 方法 系统 | ||
本发明涉及一种基于图神经网络的互联网食品实体对齐方法及系统,其方法包括:步骤S1:将待对齐的两个知识图谱KG1和KG2中三元组进行分离,得到关系三元组和属性三元组;步骤S2:更新关系三元组;步骤S3:获取实体结构特征向量和关系特征向量;步骤S4:获取实体特征向量;步骤S5:构建实体关系对齐模型,计算实体特征向量间的距离,实现实体的对齐,计算关系特征向量间的距离,实现关系的对齐。本发明提出的方法,通过对知识图谱的图结构进行补全和修剪,减少知识图谱间图的异构性的影响,同时在实体种子有限的情况下,提高了实体种子利用效率和实体对齐正确率。
技术领域
本发明涉及知识图谱和神经网络领域,具体涉及一种基于图神经网络的互联网食品实体对齐方法及系统。
背景技术
知识图谱作为机器阅读、机器翻译、推荐系统等自然语言处理任务的基础,不同研究领域建立不同的知识图谱,创建知识图谱时目的不同,侧重点不同,导致不同知识图谱会包含许多互补信息。将这些知识图谱中互补的信息整合在一起,会提高知识的利用效率,但同一实体在不同的知识图谱中可能会有不同的表现形式,这时需要实体对齐去解决这个问题。
近年来主要使用基于嵌入的方法对齐不同知识图谱中的实体,基于嵌入的实体对齐方法包括基于TransE的实体对齐和基于图神经网络的实体对齐。基于TransE的方法是根据实体和关系在空间中的平移不变性得到实体和关系的嵌入表示,使用已有的实体对齐种子将不同知识图谱中的实体和关系对应到一个向量空间。基于TransE的实体对齐方法可以保留知识图谱的结构,但需要大量的实体种子,在现实中难以得到。
基于图神经网络的实体对齐是使用图神经网络学习知识图谱中的图结构,根据图的结构特征增强实体和其邻居的信息表示,可以使用实体对齐种子传播信息到整个图。目前,基于图神经网络的实体对齐方法有关系图卷积网络(R-GCN),其对多关系图建模,为每种关系分配权重得到实体间关系的权重矩阵;高速门图卷积(HGCN-JE)使用少量的实体对齐种子学习得到实体表示,并将实体表示近似当作关系表示,通过近似关系表示训练模型。但是不同的知识图谱由于其侧重点不同,其图结构也不同,以上方法忽视了图结构的异构型;同时知识图谱中存在实体的属性信息,在实体对齐时也没有使用这部分信息。
综上所述,目前基于嵌入的实体对齐方法在很大程度上依赖对齐种子,但现实中实体对种子数量有限,同时忽略了不同知识图谱中图结构的异构性;另外属性信息和关系信息一样会对实体对齐效果产生影响,学习实体嵌入时没有用到实体的属性信息。这些问题都会影响实体对齐的效果。因此,如何处理不同知识图谱中图结构的异构性,在实体种子对数量少的情况下,提高不同知识图谱中实体对齐的正确率成为一个亟待解决的问题。
发明内容
为了解决上述技术问题,本发明提供一种基于图神经网络的互联网食品实体对齐方法及系统。
本发明技术解决方案为:一种基于图神经网络的互联网食品实体对齐方法,包括:
步骤S1:通过网络爬虫获取食品信息,抽取其中三元组,构建待对齐的两个知识图谱KG1和KG2,将所述KG1和KG2中三元组进行分离,得到关系三元组和属性三元组;
步骤S2:对所述关系三元组推理得到规则,在KG1和KG2间转移所述规则,构建新的关系三元组,更新所述关系三元组,得到更新后的关系三元组;
步骤S3:根据所述更新后的关系三元组,以及自注意力机制和跨注意力机制,计算得到两个带自注意力机制权重和跨注意力机制权重的邻接矩阵;并根据bert预训练字向量,查询向量表得到所述三元组中的实体字向量;将两个所述邻接矩阵和所述实体字向量输入图神经网络进行训练,得到实体结构特征向量和关系特征向量;
步骤S4:对所述属性三元组中的实体输入前向神经网络训练,得到实体属性特征向量;融合所述实体结构特征向量和实体属性特征向量,得到实体特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110604291.5/2.html,转载请声明来源钻瓜专利网。