[发明专利]知识图谱的处理方法及装置有效

专利信息
申请号: 201811162047.2 申请日: 2018-09-30
公开(公告)号: CN110019843B 公开(公告)日: 2020-11-06
发明(设计)人: 韩旭红 申请(专利权)人: 北京国双科技有限公司
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 赵囡囡;董文倩
地址: 100083 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 知识 图谱 处理 方法 装置
【说明书】:

发明公开了一种知识图谱的处理方法及装置。其中,该方法包括:从待分析文本中获取多组实体数据和多个候选关系模板,其中,候选关系模板用于描述一组实体数据中多个实体数据之间的关系;对于每组实体数据,确定在待分析文本中该组实体数据所匹配的候选关系模板匹配成功的次数;根据每组实体数据和各个候选关系模板匹配成功的次数,确定各组实体数据与各候选关系模板之间正确匹配的概率;根据每组实体数据与候选关系模板之间正确匹配的概率,对知识图谱中的实体数据关系进行补充。本发明解决了相关技术中对知识图谱的实体关系处理耗时耗力,降低知识图谱的构建效率的技术问题。

技术领域

本发明涉及数据处理技术领域,具体而言,涉及一种知识图谱的处理方法及装置。

背景技术

相关技术中,知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。随着人工智能的技术发展和应用,知识图谱作为关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。当前,知识图谱的构建从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,并将其存入知识库的数据层和模式层。当前知识图谱构建方法主要有三种:一种为人工构建,通过人工整理结构化数据得到;另一种为自动构建,主要通过NLP(神经语言程序学,Neuro-Linguistic Programming)技术对数据进行实体抽取,再通过模板匹配或者分类模型获取实体之间的关系,从而构建知识图谱。

但是,当前知识图谱构建面临多种问题,首先,通过人工构建知识图谱的方式,会耗时耗力,占用大量人力和时间,不利于长期使用;而使用知识图谱的模板来构建知识图谱时,准确率相对较差,会产生很多的噪声;另外,若通过分类模型来构建知识图谱,则需要大量的人工标注训练语料,即需要人工预先进行语料标注,同样需要花费大量的时间,且占用大量的人力资源,会导致构建知识图谱的效率降低。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种知识图谱的处理方法及装置,以至少解决相关技术中对知识图谱的实体关系处理耗时耗力,降低知识图谱的构建效率的技术问题。

根据本发明实施例的一个方面,提供了一种知识图谱的处理方法,包括:从待分析文本中获取多组实体数据和多个候选关系模板,其中,候选关系模板用于描述一组实体数据中多个实体数据之间的关系;对于每组实体数据,确定在所述待分析文本中该组实体数据所匹配的候选关系模板匹配成功的次数;根据每组实体数据和各个候选关系模板匹配成功的次数,确定各组实体数据与各候选关系模板之间正确匹配的概率;根据每组实体数据与候选关系模板之间正确匹配的概率,对知识图谱中的实体数据关系进行补充。

进一步地,获取多组实体数据和多个候选关系模板包括:获取所述知识图谱中的当前实体关系,其中,所述当前实体关系对应的数据类别被定义为目标实体类别;依据所述当前实体关系,从所述待分析文本的语句中抽取与所述目标实体类别对应的多组实体数据;从完成抽取后每个语句的剩余词语中删除预定语义词,其中,所述预定语义词至少包括:停用词;对所述每个语句删除后剩余的文字进行组合,得到所述多个候选关系模板。

进一步地,根据每组实体数据和各个候选关系模板匹配成功的次数,确定各组实体数据与各候选关系模板之间正确匹配的概率包括:构建矩阵,所述矩阵中包括每组实体数据和与该组实体数据匹配成功的候选关系模板以及匹配成功的次数;通过预设排序算法对所述矩阵进行迭代,得到各组实体数据与各候选关系模板之间正确匹配的概率。

进一步地,所述预设排序算法为二部图排序算法。

进一步地,确定各组实体数据与各候选关系模板之间正确匹配的概率包括:获取各组实体数据和各候选关系模板之间匹配的总数量一;确定各组实体数据与各候选关系模板之间正确匹配的数量二;依据所述数量二和总数量一,确定各组实体数据与各候选关系模板之间正确匹配的概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811162047.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top