[发明专利]一种面向用户的图数据库查询优化方法、系统在审
申请号: | 202110067794.3 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112765411A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 宋骐;罗刚;汪国航;田宝同 | 申请(专利权)人: | 合肥鸿麒科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903;G06F16/2453;G06F16/23 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 张明利 |
地址: | 230088 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 用户 数据库 查询 优化 方法 系统 | ||
本公开属于图数据处理领域,公开一种面向用户的图数据库查询优化方法、系统,包括以下步骤:针对于数据量无法完全载入系统内存的场合下,在没有用户查询数据的基础上,根据数据的获取频率,以获取频率最高的数据作为热点数据,将所述热点数据优先载入至系统内存;针对于用户查询数据,优先从系统内存中的数据获取与用户查询数据相匹配的数据,若系统内存的数据无法与用户查询数据相匹配,则从硬盘进行获取与户查询数据相匹配的数据;与现有方法相比所提方法能更加提升查询效率。
技术领域
本公开属于图数据处理领域,具体涉及一种面向用户的图数据库查询优化方法、系统。
背景技术
图数据是以节点和节点之间关联关系为核心的数据库,相对于传统关系型数据库,图数据库在研究实体关联关系方面拥有很大的优势,因为被广泛应用于社交网络、互联网、金融、人工智能等诸多领域。图结构数据的典型代表是知识图谱,其中节点代表实体,边代表实体之间的关系,同样,社交网络也是一种典型的图数据,其中节点表示用户,而边表示用户之间的关系。
图数据库作为一种新兴的专门用于存储图结构数据的数据库,提供了图数据的存储、查询等功能。
随着图结构数据的数据量越来越大,受限于有限的系统内存规模以及硬盘I/O的低速,因而对高性能的实时查询提出了巨大的挑战。当今的图数据规模在向TB甚至PB方向发展,例如Facebook发布的社交网络数据包含数十亿个节点和数千亿条边,数据规模达到数百TB,类脑神经元网络拥有数百亿个节点,数据规模同样达到TB级别。在如此大规模的数据量下,常规计算机系统无法将所有数据全部载入系统内存中,而从硬盘获取数据将会造成非常大的查询延迟。
同时用户所经常查询的数据只占整体数据的一小部分,因而将所有数据载入系统内存会造成不必要的额外开销。
发明内容
在一些公开中,本发明提出了一种面向用户的图数据库查询优化方法,与现有方法相比所提方法能更加提升查询效率。
本公开的目的可以通过以下技术方案实现:
一种面向用户的图数据库查询优化方法,包括以下步骤:
针对于数据量无法完全载入系统内存的场合下,在没有用户查询数据的基础上,根据数据的获取频率,以获取频率最高的数据作为热点数据,将所述热点数据优先载入至系统内存;
针对于用户查询数据,优先从系统内存中的数据获取与用户查询数据相匹配的数据,若系统内存的数据无法与用户查询数据相匹配,则从硬盘进行获取与户查询数据相匹配的数据。
在一些公开中,针对于系统内存的数据无法与户查询数据相匹配的场合下,系统内存中的所述热点数据的更新,包括以下步骤:
收集用户查询数据,根据从硬盘进行匹配的数据与户查询数据之间的应答率,判别是否将从硬盘进行匹配的数据作为新的热点数据,进行载入至系统内存中,用于对所述热点数据的更新。
在一些公开中,所述热点数据包括:一组节点VH、所述节点的n-跳邻居、以及n-跳邻居与节点相关联的边H(n,VH),所述n-跳邻居为对应所述节点v,所有到所述节点v的最短路径为n的节点。
在一些公开中,所述热点数据的节点最大数量x,以及所述n,满足x*m*kn≤M,M为系统内存大小,m为系统数据库每个节点平均占用内存,k为系统数据库平均每个节点的边数。
在一些公开中,在系统初始化时,将n设置为2,并得到相应的x值;在系统运行过程中,根据用户查询的相关信息,动态的调整n和x的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥鸿麒科技有限公司,未经合肥鸿麒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110067794.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人自动拧螺钉螺母装置
- 下一篇:一种牙龈取模模具及全义齿假牙取模设备