[发明专利]一种基于图谱拓扑结构和实体文本描述的深度学习方法在审
申请号: | 201810187010.9 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108681544A | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 卓汉逵;荣二虎 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 拓扑结构 文本描述 发现 注意力机制 封闭环境 实体提供 世界知识 文本信息 循环卷积 知识图 学习 网络 帮助 开放 联合 | ||
本发明提供一种基于图谱拓扑结构和实体文本描述的深度学习方法,该方法在解决知识图谱补全问题中,要补全的实体可能已经存在于知识图谱中(需发现),也可能不在知识图谱中(需生成)。对于需要发现的任务,可视作是封闭环境下的知识图补全问题,模型M1能够很好地“发现”这个实体;对于需要发现的任务,模型M2在注意力机制和循环卷积网络的帮助下,能够充分地发掘文本信息,为“生成”这个实体提供有力保障。这两个子模型的联合,能够解决开放世界知识图谱补全问题。
技术领域
本发明涉及文本处理算法领域,更具体地,涉及一种基于图谱拓扑结构和实 体文本描述的深度学习方法。
背景技术
知识图谱是(Knowledge Graph)当前大数据时代的研究热点,自从2012年 Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。 在知识图谱的研究中,知识图谱补全问题(Knowledge Graph Completion)占据 了极为重要的位置。知识图谱补全的目标是将现有不完全的知识图谱尽可能地补 全,以便丰富知识图谱包含的信息。
目前,关于知识图谱补全的相关技术有:基于众包的知识图补全、基于知识 图谱拓扑结构语义深度学习模型、基于关系推理规则的推理模型等。
开放世界知识图谱补全问题(Open-World Knowledge Graph Completion)与 封闭世界知识图谱补全问题(Close-World Knowledge Graph Completion)不同的 是,它能够将现有知识图谱中不存在的实体加入到知识图谱中来,而非仅限于当 前知识图谱中已存在的实体。开放世界知识图谱补全问题可形式化定义如下:给 定一个不完备的知识图谱G=(E,R,T),其中E,R,T分别为头部实体集、关系 集、尾部实体集,开放世界知识图谱补全问题的目标是找到这样的缺失三元组集 合其中Ei和Ti分别是E和T的超 集。
发明内容
本发明提供一种解决知识图谱补全的能力的基于图谱拓扑结构和实体文本 描述的深度学习方法。
为了达到上述技术效果,本发明的技术方案如下:
一种基于图谱拓扑结构和实体文本描述的深度学习方法,包括以下步骤:
S1:构建基于图拓扑结构的预测模型M1;
S2:构建基于注意力机制的文本处理模型M2;
S3:通过大量的训练数据训练该模型,得出两个模型内部的参数,将现有的 知识图谱结构作为子模型M1输入,相关的文本信息作为子模型M2的输入,分 别得到M1的输出和M2的输出;
S4:根据词向量字典查询,即可得出预测实体的名称。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出基于图谱拓扑结构和实体文本描述的深度学习模型方法,该方法 在解决知识图谱补全问题中,要补全的实体可能已经存在于知识图谱中(需发现), 也可能不在知识图谱中(需生成)。对于需要发现的任务,可视作是封闭环境下 的知识图补全问题,模型M1能够很好地“发现”这个实体;对于需要发现的任 务,模型M2在注意力机制和循环卷积网络的帮助下,能够充分地发掘文本信息, 为“生成”这个实体提供有力保障。这两个子模型的联合,能够解决开放世界知 识图谱补全问题。
附图说明
图1为本发明流程图;
图2为引入注意力机制的权重分配示意图;
图3为模型M2处理三元组补全问题的流程示意图;
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810187010.9/2.html,转载请声明来源钻瓜专利网。