[发明专利]用于数据搜索的方法、装置及设备在审
申请号: | 202110594906.0 | 申请日: | 2021-05-28 |
公开(公告)号: | CN115408427A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 郑卫国;张悦嘉;朱俊华 | 申请(专利权)人: | 华为技术有限公司;复旦大学 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 罗利娜 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据 搜索 方法 装置 设备 | ||
本公开的实施例提供了用于数据搜索的方法、装置及设备,涉及计算机技术领域。在本公开的用于数据搜索的方法中,获取搜索请求,搜索请求包括由多个节点和多个节点之间的多条边组成的查询图,每个节点表示对象,每条边表示对象之间的关联关系。基于查询图确定多个查询子图,每个查询子图包括多个节点中的一组节点和一组节点之间的边,多个查询子图具有多个节点中的至少一个相同节点。在目标数据图中并行地搜索与多个查询子图各自匹配的数据子图。通过合并与多个查询子图各自匹配的数据子图,来确定与查询图匹配的搜索结果。通过该方案,将针对查询图的查询任务拆分成更细粒度的子任务,并且多个子任务可以并行执行,提高搜索效率。
技术领域
本公开的实施例主要涉及计算机技术领域,更具体地,涉及用于数据搜索的方法、装置 及设备。
背景技术
图(graph)是计算机科学中的重要数据表示形式,通过节点和节点之间的边来表示对象 之间的关系。图模型在生物信息学、化学、软件工程、社交网络等各种领域发挥着重要的作 用。在图分析中,从给定数据图G中查找与查询图Q匹配的数据子图,这样的任务称为“子 图查询”。查找到的数据子图与查询图具有子图同构,即节点和边之间存在一一对应关系。子 图查询在实际场景中有着广泛的应用,例如知识图谱查询、蛋白质分析、模式匹配、社交网 络分析等等。
发明内容
本公开的实施例提供了一种在数据图中执行搜索的方案。
在本公开的第一方面,提供了一种用于数据搜索的方法。根据该方法,在获取搜索请求 之后,根据所述搜索请求中的查询图确定多个查询子图,其中,所述搜索请求包括由多个节 点和所述多个节点之间的多条边组成的查询图,每个节点表示对象,每条边表示对象之间的 关联关系,每个查询子图包括所述多个节点中的一组节点和所述一组节点之间的边,所述多 个查询子图具有所述多个节点中的至少一个相同节点。进一步的,在目标数据图中并行地搜 索与所述多个查询子图各自匹配的数据子图,以及通过合并与所述多个查询子图各自匹配的 数据子图,来确定与所述查询图匹配的搜索结果。
根据本公开的实施例,可以将针对查询图的查询任务拆分成更细粒度的子任务,并且多 个子任务可以并行执行,提高搜索效率。通过查询图的合理分解,使查询子图具有部分相同 路径(例如,节点和/或边),使得能够实现高效并行搜索,减少查询子图的匹配过程中所需 的全局同步次数。
在第一方面的一种实现方式中,基于所述查询图确定多个查询子图包括:通过对所述查 询图执行深度优先搜索DFS,将所述查询图转换为树结构,所述树结构包括所述查询图中的 所述多个节点以及所述多条边的至少一部分边;以及将所述树结构划分为所述多个查询子图, 每个查询子图包括从所述树结构的根节点到叶子节点的一条路径上的节点和边。由此,通过 转换为树结构来执行查询图分解,不同查询子图分别对应于树结构中的不同分支。这样,在 匹配时,针对单个查询子图,与查询子图中下一个节点匹配的节点,也是在目标数据图中匹 配节点的邻居节点。单个查询子图的部分匹配结果可以在该查询子图的节点之间传递,从而 可以实现多个查询子图的并行执行,而不需要在不同搜索进程之间同步部分匹配结果,避免 了冗余的中间结果。
在第一方面的一种实现方式中,所述多个查询子图中的点不具有跨查询子图的边的约束。 也就是说,一个查询子图中的节点不与另一查询子图中的节点具有边的约束关系。通过使所 分解的查询子图之间不具有节点之间的边的约束,在确定节点之间的边的约束时,只需在目 标数据图的邻居节点集内查找下一节点是否存在,即可隐式地完成邻居集取交集的操作,无 需像常规方案那样显式求交。
在第一方面的又一种实现方式中,所述在目标数据图中并性地搜索与所述多个查询子图 各自匹配的数据子图包括:在所述目标数据图中并性地搜索与第一查询子图和第二查询子图 各自匹配的数据子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;复旦大学,未经华为技术有限公司;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594906.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置