[发明专利]面向开放网络知识库的实体间关系推断方法及系统有效
申请号: | 201410072412.6 | 申请日: | 2014-02-28 |
公开(公告)号: | CN103824115B | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 程学旗;王元卓;赵泽亚;贾岩涛;冯凯;熊锦华;许洪波 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 开放 网络 知识库 实体 关系 推断 方法 系统 | ||
1.一种面向开放网络知识库的实体间关系推断方法,所述方法包括:
步骤1,根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;
步骤2,根据待推断的目标关系构造训练实体对集合,所述训练实体对集合中包括从所述知识库中找出的所有存在所述目标关系的实体对;
步骤3,基于所述训练实体对集合中各实体对间的关系以及各实体的属性信息,推断所述候选实体集中可能与该目标实体存在所述目标关系的候选实体;
其中所述开放式网络知识库以图的形式来表示,图中的节点表示知识库中的实体,图中的边表示实体间的关系,图中任意两个节点间的路径表示这两个节点对应的实体之间的关系路径;
其中所述步骤3包括:
步骤31,基于所述训练实体对集合中各实体对间的关系,训练关系路径模型;其中该关系路径模型用于判断两个实体之间存在所述目标关系的概率;
步骤32,基于训练好的关系路径模型来计算所述候选实体集中每个候选实体的关系路径得分;
步骤33,根据所述训练实体对集合中各实体的属性信息,训练关系属性模型,并根据训练好的关系属性模型找出与所述目标关系对应的显著属性集,其中该关系属性模型用于判断对于某种属性,存在所述目标关系的两个实体同时具有该属性且属性值相同的概率;
步骤34,基于所述目标关系对应的显著属性集,计算每个候选实体的属性相似度得分;
步骤35,基于候选实体的关系路径得分和属性相似度得分,从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体来作为推断的结果。
2.根据权利要求1所述的方法,所述训练实体对集合中还包括从知识库中随机选择的若干个其之间关系不是所述目标关系的实体对。
3.根据权利要求1所述的方法,所述步骤31包括:
步骤311)基于所述训练实体对集合中各实体对间的关系,构造用于训练关系路径模型的训练数据集;其中,所述训练数据集中包括与所述训练实体对集合中的每个实体对相对应的路径特征向量,该路径特征向量是由该实体对的两个实体之间所有可能存在的长度小于l的路径的概率值构成的;其中l为大于1的自然数;
步骤312)基于所构造的训练数据集来训练关系路径模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410072412.6/1.html,转载请声明来源钻瓜专利网。