[发明专利]一种融合上下文语义的知识图谱链路预测模型方法及装置有效
申请号: | 202110631995.1 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113535972B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 刘露;包铁;高迅;张雪松;彭涛 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 曹书华 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 上下文 语义 知识 图谱 预测 模型 方法 装置 | ||
本发明属于知识图谱链路预测技术领域,具体为一种融合上下文语义的知识图谱链路预测模型、方法及装置,包括输入采样子图,在输入中每个训练数据都是由n个实体构成的r‑子图谱,n指代r‑子图谱中的实体个数,根据广度优先搜索这一采样策略可生成一系列的关系序列,即一个r‑子图谱即为一条含有n个实体的关系路径,该子图谱可包含三个方面的语义信息:在知识图谱之中的结构信息、子图谱的类型属性元信息和本体信息(详细内容写于属性信息提取部分)以及实体和关系所蕴含的上下文自然语义知识信息,其结构合理,使用LSTM和GCN共同捕获知识图谱中实体的上下文语义表示,提升实体的嵌入表示能力,应用至链路预测任务中,模型性能得到提升。
技术领域
本发明涉及知识图谱链路预测技术领域,具体为一种融合上下文语义的知识图谱链路预测模型方法及装置。
背景技术
致力于知识图谱链路预测领域的三元组语义信息的表示,考虑到现存知识图谱链路预测方法对于知识图谱内语境信息的建模不充分的弊端,加之研究者使用图嵌入方法增强实体和关系的语义化向量表示泛化能力差,以及融合外部文本知识编码方法缺乏结构化知识表示且计算开销过大的问题,在2018年Tim Dettmers提出的ConvE模型基础上使用循环神经网络模型捕获知识图谱内实体间的语义关系,提出一种结构增强的循环神经知识图谱链路预测方法,实现循环神经网络技术与知识图谱两大类方法的优势互补,提升知识图谱中实体和关系的语义表示能力,进一步优化知识图谱的链路预测任务。具体地将成熟的循环神经网络方法应用至知识图谱实体和关系的嵌入表示学习之中,进一步提高了知识图谱链路预测的性能。实验结果显示,我们的方法能够有效提高知识图谱链路预测的性能、速度和泛化能力。
据实际研究和应用观察,在研究较为严谨和应用广泛的FreeBase知识库中超过70%的人的出生地点这一实体缺失。于是国内外知识科学领域的研究者开始研究纠正知识图谱中不正确的三元组和弥补缺失知识三元组的方法,这种方法被称作知识图谱补全(Knowledge Graph Completion)。为实现知识图谱补全的目的,研究人员从外部互联网语料库等其他非结构化数据中抽取出已有知识图谱中的缺失或错误知识的方法被称之为关系抽取。如果研究人员使用已有知识图谱中的知识推理、预测出新的链路,从而达到补全知识图谱的目的,这种方法称作链路预测(Link Prediction)。
在知识图谱这种网络表示形式下,人们需要针对图数据设计专门的算法来存储和利用知识图谱,存在费时费力的缺点,并且极其容易受到数据稀疏问题的影响。以深度学习为代表的表示学习(Representation Learning)技术受到人工智能领域专家的广泛关注。表示学习旨在将复杂研究对象的高维隐式结构和语义信息表示为稠密低维的实值向量的过程,知识表示学习则面向知识图谱中的实体和关系进行表示学习,将实体和关系表示为低维稠密的数值向量,这一技术被称为知识图谱嵌入(Knowledge Graph Embedding,简称KGE)。该技术可以在低维空间中高效计算实体和关系的语义联系,有效解决稀疏问题,使知识获取、融合、推理的性能得到显著提升。
针对知识图谱的链路预测研究在科学理论上和实际工程应用中都具有举足轻重的意义。
发明内容
本部分的目的在于概述本发明的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于现有知识图谱链路预测模型、方法及装置中存在的问题,提出了本发明。
因此,本发明的目的是提供一种融合上下文语义的知识图谱链路预测模型方法及装置,能够实现使用LSTM和GCN共同捕获知识图谱中实体的上下文语义表示,提升实体的嵌入表示能力,应用至链路预测任务中,模型性能得到提升。
为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110631995.1/2.html,转载请声明来源钻瓜专利网。