[发明专利]数据库负载响应时间预测模型训练样本的采集方法有效
申请号: | 201510171679.5 | 申请日: | 2015-04-13 |
公开(公告)号: | CN104794186B | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 牛保宁;张锦文 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 太原市科瑞达专利代理有限公司14101 | 代理人: | 卢茂春 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 负载 响应 时间 预测 模型 训练 样本 采集 方法 | ||
技术领域
本发明属于基于聚类的样本采集方法,是应用于数据库负载响应时间预测模型的训练采集方法。
背景技术
当前的并行数据库系统中,预测负载响应时间非常重要,可以帮助数据库管理员调解数据库参数、合理安排调度并行负载。
但由于数据库并行负载间相互影响(Interaction)机理非常复杂,传统的分析型模型建立过程复杂,预测效果不好。因此现有文献主要是建立统计模型,来预测负载的响应时间。即通过样本采集、模型训练(回归)、模型评估三步完成统计模型建立。这方面的文献主要有[1] Duggan J, Cetintemel U, Papaemmanouil O, et al. Performance Prediction for Concurrent Database Workloads[C] //Proc.of 2011 ACM SIGMOD Conference(SIGMOD’2011). Athens, Greece, 2011:337-348
[2] Ahmad M, Aboulanaga A,Babu S, et al. Modeling and Exploiting Query Interaction in Database Systems[C] //Proc.of the 17th Conference on Information and Knowledge Management (CIKM’2008).Napa Valley,US,2008:183-192
[3] Ahmad M, AboulanagaA,Babu S, et al. Qshuffler: Getting the Query Mix Right[C] //Proc. of the 24th International Conference on Data Engineering (ICDE’2008).Cancun, Mexico,2008:1415-1417
[4] Ahmad M, Duan S, Aboulanaga A, et al. Predicting Completion Times of Bath Query Workloads Using Interaction-aware Models and Simulation[C] //Proc.of the 14th International Conference on Extending Database Technology (EDBT’2011).Uppsala, Sweden,2011:449-460
[5] Ahmad M, Duan S, Aboulanaga A, et al. Interaction-aware Scheduling of Report Generation Workloads [J].The VLDB Journal,2011,20(4):589-615
[6] Sheikh M B, Minhas U F, Khan O Z, et al. A Bayesian Approach to Online Performance Modeling for Database Appliances Using Gaussian Models[C] //Proc.of8th International Conference on Autonomic Computing(ICAC’2011).
Karlsruhe, Germany,2011:121-130。
但上述统计模型对应的采样方法没有考虑负载间相互影响,仅通过对全样本空间的特定抽样或随机抽样获得样本。随着数据库数据量增大,负载运行时间增加,如果不精选训练样本,会导致模型训练时间变长,模型建立的成本将会变得非常大。
发明内容
为了减少模型建立成本,缩短模型建立时间,本发明提供一种训练样本的采集方法,可以在不明显降低模型预测精度的同时,减少模型建立成本。
本发明的技术方案:数据库负载响应时间预测模型训练样本的采集方法,包括下述内容:
1、获取数据库每一个负载单独运行时的响应数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510171679.5/2.html,转载请声明来源钻瓜专利网。