[发明专利]面向开放网络知识库的实体间关系推断方法及系统有效
申请号: | 201410072412.6 | 申请日: | 2014-02-28 |
公开(公告)号: | CN103824115B | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 程学旗;王元卓;赵泽亚;贾岩涛;冯凯;熊锦华;许洪波 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 开放 网络 知识库 实体 关系 推断 方法 系统 | ||
技术领域
本发明涉及开放网络知识库,尤其涉及开放网络知识库中实体间关系推断的方法。
背景技术
知识库(Knowledge Base)是知识工程中一种结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储,组织,管理和使用的互联关系的知识片集合。这些知识片包括与领域相关的理论知识,实时数据,由专家经验得到的启发式知识,如某领域内有相关定义,定理和运算法则以及常识性知识等。知识库的主要作用有以下几点:知识库使信息和知识有序化,是知识库对信息组织的首要贡献;知识库加快知识和信息的流动,有利于知识共享与交流;知识库还有利于实现不同组织的协作与沟通;知识库可以帮助企业实现对客户知识的有效管理。但是普通的知识库有知识类型简单,内容单一,专业性较强等缺点,而面向开放网络的知识库是通过对于开放网络中的各种知识进行抽取,提炼,分析,最终构建一个知识内容丰富,结构统一的知识网络。
基于开放网络知识库的实体间关系推断,对于知识库的丰富与完善、潜在知识的挖掘具有重要意义。在基于开放网络知识库的关系推理中,知识库实体类型主要有人物、事件、组织机构、地点等,而它们之间的关系类型则十分多样化。针对不同的实体类型,所关注的关系也是不同的,对于人物实体之间,常见关系有亲人及朋友关系;对于人与组织机构之间,常见关系有工作单位、毕业院校;对于组织机构之间,常见关系有下属机构、相关机构等。这些已知的实体间的关系在原始的知识网络中比较稀疏,而实际上实体间还存在大量的隐含关系,可以通过知识库中已有的知识和关系,来发掘这些隐含关系。最常用的挖掘方法是基于规则的方法,即通过对已有知识的分析,制定合适的推断规则,最终由这些规则推出实体间的关系。但这种方法由人工来制定规则,工作量很大且能制定的规则数量有限,涵盖范围较小,具有较大的局限性。有研究者提出了基于实体间的路径关系进行推断的方法,该方法可省去复杂的人为制定规则的过程,自动学习到推理规则来对实体间的关系进行推理,但当实体间路径数量较少,或实体间关系信息缺乏时,这种方法的推断效果会非常差。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种新的面向开放网络知识库的实体间关系推断方法。
本发明的目的是通过以下技术方案实现的:
一方面,本发明提供了一种面向开放网络知识库的实体间关系推断方法,包括:
步骤1,根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;
步骤2,根据待推断的目标关系构造训练实体对集合,所述训练实体对集合中包括从所述知识库中找出的所有存在所述目标关系的实体对;
步骤3,基于所述训练实体对集合中各实体对间的关系以及各实体的属性信息,推断所述候选实体集中可能与该目标实体存在所述目标关系的候选实体。
上述方法中,所述步骤3可包括:
步骤31,基于所述训练实体对集合中各实体对间的关系,训练关系路径模型;其中该关系路径模型用于判断两个实体之间存在所述目标关系的概率;
步骤32,基于训练好的关系路径模型来计算所述候选实体集中每个候选实体的关系路径得分;
步骤33,根据所述训练实体对集合中各实体的属性信息,训练关系属性模型,并根据训练好的关系属性模型找出与所述目标关系对应的显著属性集,其中该关系属性模型用于判断对于某种属性,存在所述目标关系的两个实体同时具有该属性且属性值相同的概率;
步骤34,基于所述目标关系对应的显著属性集,计算每个候选实体的属性相似度得分;
步骤35,基于候选实体的关系路径得分和属性相似度得分,从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体来作为推断的结果。
上述方法中,所述开放式网络知识库可以以图的形式来表示,图中的节点表示知识库中的实体,图中的边表示实体间的关系,图中任意两个节点间的路径表示这两个节点对应的实体之间的关系路径。
上述方法中,所述训练实体对集合中还可包括从知识库中随机选择的若干个其之间关系不是所述目标关系的实体对。
上述方法中,所述步骤31可包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410072412.6/2.html,转载请声明来源钻瓜专利网。