[发明专利]知识图谱子图匹配的动态控制方法和系统有效

专利信息
申请号: 202210376431.2 申请日: 2022-04-12
公开(公告)号: CN114461734B 公开(公告)日: 2022-07-12
发明(设计)人: 游东海;赵培龙;刘志臻;成强 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06K9/62
代理公司: 上海专利商标事务所有限公司 31100 代理人: 段登新
地址: 310023 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 知识 图谱 匹配 动态控制 方法 系统
【说明书】:

本公开提供了一种知识图谱子图匹配的动态控制方法,包括:加载知识图谱数据;获取针对知识图谱子图匹配的预期执行时长以及预定义裁剪策略;按深度执行子图匹配,其中在执行中获取并动态更新每个深度的消息处理速度和消息扩展量;基于所获取并更新的每个深度的消息处理速度和消息扩展量,估算知识图谱子图匹配的执行时长;以及当所估算的执行时长超过预期执行时长时,根据预定义裁剪策略裁剪该知识图谱子图,以缩短知识图谱子图匹配的执行时长。

技术领域

本公开主要涉及知识图谱,尤其涉及知识图谱子图匹配。

背景技术

在知识图谱中,可采用RDF(Resource Description Framework,即资源描述框架)或图数据库(例如,Neo4j等)来构成网状的知识结构。为便于知识图谱的应用,常常采用图匹配(graph matching,GM)技术来利用图结构的相似度信息寻找图结构间节点之间的匹配关系,由此获得精准的匹配项,以供后续处理。

随着大规模子图匹配系统逐渐向深度优先搜索(DFS)方向转变,单机的物理资源不再成为瓶颈,海量中间结果也不再需要一次性缓存,因此进行超大规模子图匹配计算成为了可能。但是在超大规模图上,相应的执行时间会变得非常长,且不可忍受。

为了减少执行时间,在业务可以接受的精度损失范围内,可以对热点进行裁剪,采用对中间结果设置阈值等策略,减少执行时间。但是这种方法需要依赖人工尝试和调整。

因此,本领域需要高效和自动的动态控制知识图谱子图匹配任务的执行时间的方案,以使大规模子图匹配系统获得合适的成本效率。

发明内容

为解决上述技术问题,本公开提供了一种知识图谱子图匹配的动态控制方案,通过设置知识图谱子图匹配任务的期望执行时间并定义知识图谱子图匹配任务的裁剪策略,自动调整知识图谱子图匹配任务的执行时长,在可接受的成本内(即,所使用的机器资源和时间均可接受)使系统达到最好的业务效果。

在本公开一实施例中,提供了一种知识图谱子图匹配的动态控制方法,包括:加载知识图谱数据;获取针对知识图谱子图匹配的预期执行时长以及预定义裁剪策略;按深度执行子图匹配,其中在执行中获取并动态更新每个深度的消息处理速度和消息扩展量;基于所获取并更新的每个深度的消息处理速度和消息扩展量,估算知识图谱子图匹配的执行时长;以及当所估算的执行时长超过预期执行时长时,根据预定义裁剪策略裁剪该知识图谱子图,以缩短知识图谱子图匹配的执行时长。

在本公开另一实施例中,针对知识图谱子图匹配的预期执行时长以及预定义裁剪策略从用户端处获取。

在本公开又一实施例中,针对知识图谱子图匹配的预期执行时长以及预定义裁剪策略是按场景预设的。

在本公开另一实施例中,预定义裁剪策略包括边数据采样策略、热点边按阈值裁剪策略、以及中间路径结果剪枝策略。

在本公开又一实施例中,预定义裁剪策略可按待匹配子图上不同的边而不同。

在本公开另一实施例中,预定义裁剪策略中的裁剪阈值可动态调整。

在本公开又一实施例中,预定义裁剪策略中的裁剪阈值的动态调整包括起始采用最严格阈值,并且如果资源够用,则逐渐向更大阈值调整。

在本公开另一实施例中,起始采用最严格阈值包括估算采用最严格阈值时的执行时长,以及当所估算的执行时长超过预期执行时长时,则退出该子图匹配的任务。

在本公开又一实施例中,逐渐向更大阈值调整包括:从最严格阈值起增大当前阈值,直到资源利用达到最大,并估算采用当前阈值时的执行时长;当所估算的执行时长未超过预期执行时长时,采用当前阈值;以及当所估算的执行时长超过所述预期执行时长时,逐步降低当前阈值,直到达到预期执行时长。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210376431.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top