[发明专利]一种基于知识图谱的关系预测方法在审
申请号: | 201810589288.9 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108694469A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 王念滨;秦帅;陈锡瑞;王红滨;周连科;白云鹏;王勇军;何茜茜;原明旗;陈田田 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 三元组 迭代 构建 初始化参数 关系利用 关系嵌入 混合关系 评价函数 双向关系 损失函数 向量空间 预测算法 分子图 嵌入式 数据集 图结构 无向图 预测 低维 算法 隐含 取出 标签 评估 改进 发现 联合 | ||
本发明为一种基于知识图谱的关系预测方法,将知识图谱利用无向图来表示,提出了一种改进的结合了双向关系路径和嵌入式的混合关系预测算法,包括如下步骤:(1)将三元组数据集构建一个有效的知识图谱,并初始化参数;(2)对知识图谱中每个实体和关系利用TransE算法进行训练,将实体和关系嵌入到一个低维的向量空间中;(3)抽取出每个三元组的关系标签,构建每个关系的子图;(4)在每个关系子图上,通过迭代的方式发现每个实体之间的可达路径,并根据图结构划分子图,对每个可达路径的可靠性进行计算;(5)迭代每两个没有直接边连接的实体,通过构造的联合评价函数和损失函数来评估两个实体之间是否存在隐含关系;(6)补全知识图谱结构。
技术领域
本发明涉及在RDF知识图谱条件下的知识图谱补全算法领域,具体涉及一种基于知识图谱的关系预测方法。
背景技术
信息技术的发展不断推动着互联网技术的变革,Web技术作为互联网时代的标志性技术,正处于这场技术变革的核心。从网页的链接到数据的链接技术正在逐步朝向Web之父Berners-Lee设想中的语义网络sematic Web演变。根据W3c的解释,语义网络是一张数据构成的网络Web of data,语义网络技术向用户提供的是一个查询环境,其核心要义是以图形的方式向用户返回经过加工和推理的知识。而知识图谱knowledge graph技术则是实现智能化语义检索的基础和桥梁。传统搜索引擎技术能够根据用户查询快速排序网页,提高信息检索的效率。然而,这种网页检索效率并不意味着用户能够快速准确地获取信息和知识,对于搜索引擎反馈的大量结果,还需要进行人工排查和筛选.随着互联网信息总量的爆炸性增长,这种信息检索方式已经很难满足人们全面掌控信息资源的需求,知识图谱技术的出现为解决信息检索问题提供了新的思路知识图谱是近年来的一种新兴技术,其技术理论和概念是结合知识库、语义网络以及本体论等思想,由Google于2012年提出的。知识图谱的本质上是一种基于复杂语义网络的图形结构,它充分利用了可视化技术,不仅能够对知识资源和载体进行描述,而且还可以对知识以及知识之间的联系进行分析和描述。它利用图形的方式将复杂的知识绘制并展现出来,用图中的节点来表示知识,用节点之间的边来表示知识之间的关系,这样更直观的体现知识之间的关联。
知识图谱的主要任务之一是解决链接预测问题。链接预测是指对知识图谱中可能存在的关系进行预测。知识图谱利用两个节点之间的边来体现它们的关系,但事实上,两个不存在边连接的节点之间也存在着隐含关联,这种特性被称为知识图谱的不完整性。因此,基于知识图谱的关联分析任务之一就是如何准确的发现这种隐含关系,并且避免错误的关系。这种基于知识图谱的链接预测任务被称为知识图谱的关系推理、关系预测或者知识图谱补全。
目前,对于知识图谱上的关系预测方法国内外学者都在积极的研究,但由于知识图谱结构的复杂性,如何更好的提升多关系预测的效果成为研究的难点。针对这种问题,本发明对基于知识图谱的关系预测方法进行了深入研究,提出了一种改进的结合了双向关系路径和嵌入式的混合关系预测算法。该算法的主要思想是考虑到关系的双向语义的特点,将知识图谱利用无向图来表示。并基于无向图的概率模型来获得每个实体之间的依赖程度,由此来对关系路径的可靠性进行评估。然后,将此模型与TransE算法联合构造评分函数,来对知识图谱中存在的隐含关系进行推理。
发明内容
本发明的目的在于提供一种基于知识图谱的关系预测方法,具体包括如下步骤:
(1)将三元组数据集构建一个有效的知识图谱,并初始化参数;
(2)对知识图谱中每个实体和关系利用TransE算法进行训练,将实体和关系嵌入到一个低维的向量空间中;
(3)抽取出每个三元组的关系标签,构建每个关系的子图;
(4)在每个关系子图上,通过迭代的方式发现每个实体之间的可达路径,并根据图结构划分子图,对每个可达路径的可靠性进行计算;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589288.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理