[发明专利]知识融合方法、装置、计算机设备和存储介质有效
申请号: | 201910884962.0 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110807102B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 凌岚;刘嘉伟;于修铭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谭争勇 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 融合 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及知识图谱技术领域,尤其涉及一种知识融合方法、装置、计算机设备和存储介质,包括:获取待分析数据,根据所述待分析数据的数据结构,提取所述待分析数据中的实体数据;将所述实体数据进行实体对齐,得到初步融合数据;获取所述初步融合数据中的关系路径,根据所述关系路径,构建关系分类的特征向量;根据所述特征向量,确定所述初步融合数据中未连接的实体数据之间的关系数据后,得到待检融合数据;对所述待检融合数据进行问题信息查询,去除所述问题信息后,得到最终融合数据。本申请通过在知识融合过程中加入知识纠错的步骤,能够有效的去除知识融合过程中产生的错误数据,从而提升知识融合后构成的知识图谱在进行知识抽取时的效率。
技术领域
本申请涉及知识图谱技术领域,尤其涉及一种知识融合方法、装置、计算机设备和存储介质。
背景技术
知识图谱技术日益成为人工智能的基础,它是机器理解自然语言和构建知识网络的重要方法。在进行知识图谱的构建时,需要对知识数据进行有效的整合才能使知识图谱在各个领域良好应用。
然而,现有的知识图谱融合技术尚不完善,通常只采用简单的实体融合方式构建知识图谱。这种方式构建的知识图谱在进行知识抽取时需要占用系统大量资源和线程。并且,应用此种方式得到的知识图谱在进行分析时错误率较高,不能应用于工业领域。
发明内容
基于此,针对现有知识图谱在进行知识抽取时需要占用系统大量资源和线程,在进行分析时错误率较高,不能应用于工业领域的问题,提供一种知识融合方法的、装置、计算机设备和存储介质。
一种知识融合方法,包括如下步骤:
获取待分析数据,根据所述待分析数据的数据结构,提取所述待分析数据中的实体数据;
将所述实体数据进行实体对齐,得到初步融合数据;
获取所述初步融合数据中的关系路径,根据所述关系路径,构建关系分类的特征向量;
根据所述特征向量,确定所述初步融合数据中未连接的实体数据之间的关系数据后,得到待检融合数据;
对所述待检融合数据进行问题信息查询,去除所述问题信息后,得到最终融合数据。
在其中一个可能的实施例中,所述获取待分析数据,根据所述待分析数据的数据结构,提取所述待分析数据中的实体数据,包括:
获取所述待分析数据的数据来源标识,根据所述数据来源标识,确定所述待分析数据的数据结构;
若所述待分析数据为结构化表格,则根据所述实体数据在所述结构化表格中的位置,对所述待分析数据进行实体数据的提取;
若所述待分析数据为非结构化数据,则应用预设的实体词典,对所述待分析数据进行实体数据的提取。
在其中一个可能的实施例中,所述将所述实体数据进行实体对齐,得到初步融合数据,包括:
从所述实体数据中提取出两个或者两个以上具有相同名字的实体;
将所述两个或者两个以上具有相同名字的实体与预设的实体集合中的元素进行比较;
若所述两个或者两个以上具有相同名字的实体与预设的实体集合中的同一个元素相同,则所述两个或者两个以上具有相同名字的实体为同一实体;
将属于同一实体的实体数据进行实体合并后,得到所述初步融合数据。
在其中一个可能的实施例中,所述将所述实体数据进行实体对齐,得到初步融合数据,包括:
获取预设的实体区分模型,所述实体区分模型中包含实体向量和关系向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910884962.0/2.html,转载请声明来源钻瓜专利网。