[发明专利]基于深度图压缩算法的并行查询表现预测系统及方法有效
申请号: | 202010342856.2 | 申请日: | 2020-04-27 |
公开(公告)号: | CN111581454B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 李国良;周煊赫 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/9032;G06N3/0464;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 压缩 算法 并行 查询 表现 预测 系统 方法 | ||
本发明公开了一种基于深度图压缩算法的并行查询表现预测系统及创建和使用方法,该系统包括:查询预处理模块,用于对并行查询信息进行提取,并更新负载图的节点和边特征,以及对负载图进行合并;在线预测模块,用于利用模型计算出负载图上并行查询的执行特征;离线训练模块,用于利用历史数据训练深度图压缩模型和深度学习模型以学习模型的参数。该系统可以较准确地预测数据库中并行查询的执行表现。
技术领域
本发明涉及信息检索技术领域,特别涉及一种基于深度图压缩算法的并行查询表现预测系统及方法。
背景技术
在数据库系统中,预测查询任务的执行表现对于满足服务等级协议(Service-Level Agreement,SLA)有非常重要的意义,如可以应用到负载调度、参数调优、进程监控等多种优化任务中。
然而,现有的预测方法主要面向串行查询,不能高效的预测并行执行的查询任务表现。一个主要原因就是他们没有考虑并行执行的查询任务之间复杂的关联关系,如数据共享、读写冲突等。这些关联关系会显著的影响查询任务实际的执行表现。尽管有一些支持并行查询预测的传统方法,他们主要面临两个问题。首先,传统方法主要通过统计查询任务执行过程中的逻辑指标(如页访问延迟等)来估计执行时间,不仅浪费较长的时间用于监控统计指标,而且忽略了资源/数据竞争(如读写冲突导致的访问锁机制)造成的执行时间差异。其次,一些方法基于数据库提供的查询计划进行表现预测,没有对目标任务和并行任务之间的潜在执行关系进行编码,导致在负载变化时预测精度变差。
因此,在预测并行执行的查询表现过程中,主要面临两个方面的挑战:
(1)如何对并行执行的查询任务进行建模。直观来说,为了预测执行时间等表现特征,需要对查询任务的执行过程中可能影响最终表现的因素进行建模,如物理层面的执行逻辑,物理算子的特性等。然而,现有方法,一方面不能有效的评估执行过程中并行任务可能造成的影响,如共享数据可能加速执行,抢占内存导致执行变慢等;另一方面,他们主要依赖执行计划、逻辑执行指标(如页访问延迟)等特征进行建模,难以对当前查询任务的执行进度进行有效的预测追踪。因此,对于提交到数据库的查询任务,一方面,要根据算子执行中可能存在的关联关系建立图模型;另一方面,需要根据执行进度更新图模型,更好的反映当前的执行进度。
(2)如何预测并行执行的查询任务的表现。前一个问题中,需要把并行查询的执行特征建模成图模型。然而,现有预测方法很难应用在图模型上。一方面,现有方法基于线性回归等算法,预测过程中将查询本身的特性和查询间的关系用相同的方式进行处理,没能区别算子特性和关联关系对执行表现的影响;另一方面,图模型中包含大量的结构特征,将图模型线性的分割成线性的特征序列会造成较大的信息丢失,导致预测结果不准确。因此,需要利用更加高效的图压缩算法,首先能够根据原始图模型捕获每个节点邻居子图的结构特征,其次将图的结构特征进行有效的压缩,映射到和表现特征强关联的抽象特征空间中。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于深度图压缩算法的并行查询表现预测系统,该系统可以较准确地预测数据库中并行查询的执行表现。
本发明的另一个目的在于提出一种基于深度图压缩算法的并行查询表现预测系统的创建方法。
本发明的再一个目的在于提出一种基于深度图压缩算法的并行查询表现预测系统的使用方法。
为达到上述目的,本发明一方面实施例提出了一种基于深度图压缩算法的并行查询表现预测系统,包括:查询预处理模块、在线预测模块和离线训练模块;
所述查询预处理模块,用于对并行查询信息进行提取,并更新负载图的节点和边特征,以及对负载图进行合并;
所述在线预测模块,用于利用模型计算出负载图上并行查询的执行特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010342856.2/2.html,转载请声明来源钻瓜专利网。