[发明专利]一种基于约简锚点的大规模知识图谱融合方法有效

申请号：	201810780963.6	申请日：	2018-07-17
公开（公告）号：	CN109033303B	公开（公告）日：	2021-07-02
发明（设计）人：	汪鹏	申请（专利权）人：	东南大学
主分类号：	G06F16/36	分类号：	G06F16/36;G06F40/30
代理公司：	南京众联专利代理有限公司 32206	代理人：	叶涓涓
地址：	211189 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于约简锚点的大规模知识图谱融合方法，包括：大规模知识图谱解析和预处理；约简集构造：计算两知识图谱实体间的语义描述文档相似度；确定正约简锚点和负约简锚点；混合匹配算法，根据约简锚点预测出后继匹配计算中大量无需计算的匹配位置；匹配结果抽取。本发明能有效处理实际应用中的大规模知识融合任务，具有良好的效果和性能。本发明无需在匹配过程中对大知识图谱进行划分，从而可以避免大知识图谱划分失效造成的语义信息损失，保证匹配结果的精确度和召回率，且具有和划分知识图谱而采用的分治方法同等的匹配效率。
搜索关键词：	一种基于约简锚点大规模知识图谱融合方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于约简锚点的大规模知识图谱融合方法，其特征在于，包括如下步骤：1)大规模知识图谱解析和预处理：对输入的两个大规模知识图谱进行解析，获得后继匹配计算中需要用到的实体、实体层次和其它语义信息；2)约简集构造：a)首先计算两知识图谱实体间的语义描述文档相似度：获得实体语义上下文的快照；得到实体的上下文快照后，抽取实体在此快照中的上下文子图，并进而构造实体的语义描述文档；计算语义描述文档的相似度，先将其转化为文档向量，然后计算向量夹角余弦得到相似度；b)其次确定正约简锚点和负约简锚点：如果相似度大于给定阈值ptValue，则认为当前的实体对是一个正锚点，根据正锚点的特点来构造正约简集，根据正锚点来预测后继匹配计算中可跳过的位置；如果相似度小于给定阈值ntValue，则认为当前的实体对是一个负锚点，根据负锚点的特点来构造负约简集，根据负锚点预测后继相似度计算中可跳过的位置；c)混合匹配算法：将上述两种匹配算法进行综合，同时得到正锚点和负锚点及其相应的约简集，并去除已匹配过的位置和与先前的约简集重复那部分，得到有效约简集，混合预测算法中的匹配顺序采用基于负锚点的预测算法的匹配次序；可跳过匹配位置预测：对于每个需要进行匹配计算的实体对，如果已存在于上述动态构造的约简集中，则可跳过当前的匹配计算；匹配过程直到所有的实体对相似度计算均完成；3)匹配结果抽取：根据匹配计算得到的两知识图谱的实体相似矩阵，抽取匹配结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810780963.6/，转载请声明来源钻瓜专利网。

上一篇：一种页面跳转方法、装置、终端及存储介质
下一篇：基于在线深层主题模型的多模态检索方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于约简锚点的大规模知识图谱融合方法有效

专利文献下载