[发明专利]一种用于知识超图的可解释性链接预测方法在审
| 申请号: | 202210324786.7 | 申请日: | 2022-03-30 |
| 公开(公告)号: | CN114780879A | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 王鑫;陈子睿;王晨旭;刘鑫 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/36;G06N7/00 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李丽萍 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 知识 超图 解释性 链接 预测 方法 | ||
本发明公开了一种用于知识超图的可解释性链接预测方法,包括基于知识超图嵌入模型和马尔科夫逻辑网络构建可解释的知识超图表示学习模型;通过马尔科夫逻辑网络为知识超图的所有可观测元组和隐元组建立联合概率,以最大化可观测元组的对数似然为训练目标;采用变分EM算法优化对数似然函数的置信下界实现模型的训练和验证;利用验证后的可解释的知识超图表示学习模型对知识超图数据集进行链接预测,即将知识超图数据集中的一个隐元组作为该模型的输入,该模型输出该隐元组成立的概率值和与该隐元组相连的实体和关系对该隐元组成立的贡献度。利用本发明方法能够充分利用逻辑规则中的领域知识及向量空间中的语义信息,提升知识超图表示学习的效果。
技术领域
本发明涉及知识超图,尤其涉及一种面向大规模知识超图的表示学习。
背景技术
随着互联网的迅速发展,数据量呈爆炸性的增长。为深入理解用户查询背后的语义信息,进而增强搜索引擎搜索质量,Google公司在2012年第一次提出了知识图谱(Knowledge Graph)这一概念。知识图谱形式化地描述现实世界中的事物及其相互之间的关系,是以图的形式存储人类知识的大规模语义网络。它将知识表示为三元组p(s,o),其中p是谓语,s是主语,o是宾语。一个三元组p(s,o)用于表示资源s与资源o之间具有关系p,或资源s具有属性p且其取值为o。
知识超图(Knowledge Hypergraph)是一种图结构的知识库,以多元组的形式存储世界上的事实,可以被视作知识图谱的推广,他将知识表示为n元组p(e1,…,en-1),其中p是谓语,ei是组成元组的第i个实体。一个n元组用于表示资源ei间具有关系p。由于现实世界中存在大量事实,在知识超图中储存所有事实是不现实的。所以对现有知识超图的最大挑战是其严重的不完整性,即部分实体间的链接是缺失的。以Freebase为例,其包含的关系有61%是多元关系,其储存的超过三分之一的实体参与到了多元关系的组成中。面对知识超图的高度不完整性,手动为实体间添加链接是十分耗费人力和物力的,因此产生了对自动推理实体间缺失链接算法的需求。
知识超图表示学习旨在将实体和关系嵌入为连续低维的向量,以便有效地存储和计算。通过使用这些向量表示,可以有效地表示实体和关系的语义关联,也可以有效地解决计算效率低和数据稀疏的问题。知识表示学习的这些特点对知识超图的构建、推理和应用起着重要的作用。m-TransH是一种代表性的知识超图表示学习方法,它将实体和关系投影到同一个向量空间中。m-TransH模型简单高效,在链接预测问题上取得了可喜的成果。目前研究人员已经提出了几种增强的m-TransH模型,包括RAE和NaLP,以提高知识超图在预测和推理方面的能力。然而,知识超图嵌入方法仍然存在两个关键性的挑战。
(1)链接预测的结果不具有可解释性。现有的知识图谱嵌入方法大多为纯数据驱动的黑盒模型,无法清晰表明某个实体或关系对推理结果的贡献度,也无法给出关于预测可靠性的任何信息。对于诸如银行、医疗、法律等决策会产生影响重大的领域而言,给出推理结果的具体缘由是十分重要的。因此,如何成为一个紧迫的技术问题。
(2)嵌入方法无法与逻辑规则的领域知识结合完成推理。目前的大部分表示学习研究集中于保留实体和关系的语义信息以有效预测缺失的n元组,然而一个局限性是,它们没有利用到逻辑规则,逻辑规则可以紧凑地编码领域知识,这在包括解释推理结果等诸多应用中都很有用。因此,使嵌入方法与逻辑规则同步完成推理以同时利用嵌入空间中的语义信息和逻辑规则中的领域知识是知识表示学习未来研究的一个重要方向。
综上所述,急需一种新的具备可解释性并能够同时利用嵌入空间中的语义信息和逻辑规则中的领域知识的知识超图表示学习方法,解决现有技术中存在的链接预测的结果不具有可解释性和嵌入方法推理无法融入领域知识这两个关键性挑战。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210324786.7/2.html,转载请声明来源钻瓜专利网。





