[发明专利]一种知识图谱动态更新方法及其终端在审
申请号: | 202310074337.6 | 申请日: | 2023-01-16 |
公开(公告)号: | CN116108201A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 吴弘毅;林永清;刘添强;戴诗琪;吴闽帆 | 申请(专利权)人: | 四创科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/23;G06F16/28;G06F16/215;G06F16/242 |
代理公司: | 福州市博深专利事务所(普通合伙) 35214 | 代理人: | 谢子能 |
地址: | 350000 福建省福州市晋安*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 动态 更新 方法 及其 终端 | ||
1.一种知识图谱动态更新方法,其特征在于,包括以下步骤:
S1、更新数据源并捕获更新信息,将捕获的所述更新信息存入消息队列;
S2、提取所述更新信息,并清洗和筛选数据,将数据映射到实体关系中;
S3、根据所述实体关系更新知识图谱,判断是否更新成功;
S4、若更新失败,则将更新失败的数据存入重试队列,并重复执行步骤S2、S3,直至更新成功,完成知识图谱的更新。
2.根据权利要求1所述的一种知识图谱动态更新方法,其特征在于,步骤S1中所述数据源有两类,一类为数据库,另一类为文件;
所述数据库的更新通过数据库的事务日志获取;
所述文件的类型包括非结构化数据和半结构化数据,所述文件的捕获更新通过存储的日志获取。
3.根据权利要求1所述的一种知识图谱动态更新方法,其特征在于,步骤S1中所述更新信息包括主数据、元数据和数据更新时间。
4.根据权利要求1所述的一种知识图谱动态更新方法,其特征在于,步骤S1中所述消息队列用于存放数据的变更信息,并提供分区分片功能。
5.根据权利要求1所述的一种知识图谱动态更新方法,其特征在于,步骤S2中所述提取更新信息具体为:使用大数据流处理平台提取更新信息。
6.根据权利要求2所述的一种知识图谱动态更新方法,其特征在于,步骤S2中所述清洗和筛选数据具体为:
通过阈值检查或大数据趋势判断,对所述数据库的数据进行清洗;通过图像、音频和视频的识别,对所述文件的数据进行清洗;
通过规则表或向量相似度判断所述数据源是否在知识图谱领域内,若否,则筛除所述数据源,完成对清洗后的数据的筛选。
7.根据权利要求3所述的一种知识图谱动态更新方法,其特征在于,步骤S2中所述将数据映射到实体关系具体为:
根据所述元数据确定数据映射关系,将数据库数据源的表和列,分别对应到知识图谱的概念和属性上,通过数据库的外键确定概念和关系;
通过文件名的编码确定文件对应的概念-属性以及概念-关系。
8.根据权利要求1所述的一种知识图谱动态更新方法,其特征在于,步骤S3中所述根据实体关系更新知识图谱具体为:
通过知识图谱数据更新接口,将映射后的数据更新到知识图谱上;所述更新接口的接口参数中包括表明数据是新增、修改或删除状态的参数,以及数据对应的概念、属性、关系信息。
9.根据权利要求8所述的一种知识图谱动态更新方法,其特征在于,步骤S3中所述判断是否更新成功具体为:
通过所述更新接口的后端和知识图谱底层的软件开发工具包交互,若有错误,则返回错误信息;若没有错误信息,则为更新成功。
10.一种知识图谱动态更新终端,包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的一种知识图谱动态更新方法中的各个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四创科技有限公司,未经四创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310074337.6/1.html,转载请声明来源钻瓜专利网。