[发明专利]一种提高应用系统在关系数据库的空间与时间效率的方法有效
| 申请号: | 201510830217.X | 申请日: | 2015-11-25 |
| 公开(公告)号: | CN105512184B | 公开(公告)日: | 2019-06-21 |
| 发明(设计)人: | 郑锐韬;郭树盛;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
| 主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/28 |
| 代理公司: | 广东莞信律师事务所 44332 | 代理人: | 余伦 |
| 地址: | 523808 广东省东莞市松山湖高*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 应用系统 查询语句 关系数据库 查询 查询条件 缓存空间 计算公式 时间效率 查询表 解析树 字段 关系数据库数据 读取 缓存 查询频率 缓存优化 机器学习 时间要求 算法计算 缓存阀 算法 应用 分解 回归 优化 分析 | ||
1.一种通过机器学习提高应用系统在关系数据库的空间与时间效率的方法,其特征在于:通过分析特定应用系统的查询语句,把查询语句分解为解析树,通过解析树把查询语句按查询字段、查询表、查询条件,分别应用MLFU、LFU、fp-groupth算法,按查询字段、查询表、查询条件作为输入,通过回归算法计算得出查询语句的缓存阀值计算公式;在应用系统进行查询时,通过缓存阀值计算公式,判断查询的数据是否可能在缓存空间中、或是否需要缓存到空间上;
在所有查询语句分解为解析树后,查询字段、查询表、查询条件分别应用MLFU、LFU、fp-groupth算法,分别计算出查询字段、查询表、查询条件在所有查询语句中的比率,并按从高到低的顺序排序;
分析查询字段、查询表、查询条件的数量,对于大于一定比率的查询语句,表示是经常要使用到的,在进行打分时,设置为1,低于一定比率的查询语句,表示不经常使用到,在打分时设置为0;得出了从0到7的8种分数;
通过查询字段、查询表、查询条件的占所有查询结果的比率,与最终的0到7的打分,形成最终的回归分析基础数据,从而得出按查询字段、查询表、查询条件作为输入的查询语句的缓存阀值计算公式。
2.根据权利要求1所述的提高应用系统在关系数据库的空间与时间效率的方法,其特征在于:对应用系统特定的查询语句的分析、通过机器学习用回归算法得出缓存阀值计算公式后实现数据查询的优化,分为查询语句机器学习与查询缓存策略两部分。
3.根据权利要求1所述的提高应用系统在关系数据库的空间与时间效率的方法,其特征在于:在查询语句机器学习时,需把应用系统的所有查询语句获取到,并对所有的查询语句按查询字段、查询表、查询条件分解为解析树。
4.根据权利要求2所述的提高应用系统在关系数据库的空间与时间效率的方法,其特征在于:在查询语句机器学习时,需把应用系统的所有查询语句获取到,并对所有的查询语句按查询字段、查询表、查询条件分解为解析树。
5.根据权利要求1至4任一项所述的提高应用系统在关系数据库的空间与时间效率的方法,其特征在于:在通过机器学习得出缓存阀值计算公式后,把计算公式写入到缓存系统中,在数据查询输入语句时,系统先对查询语句按查询字段、查询表、查询条件进行分解成解析树,并获取查询字段、查询表、查询条件的在所有查询语句中的占比,输入缓存阀值计算公式,得出查询语句的缓存阀值;
当缓存阀值小于应用系统指定的定值时,表示查询语句相对比较少使用到,所以此查询语句查询的数据不需要缓存,在缓存空间上也不会存在,数据直接从数据文件上读取,并返回给用户;
当缓存阀值大于等于应用系统指定的定值时,表示查询语句会经常使用到,此查询语句的数据需缓存到空间上,用于以后的数据查询,此时,会在缓存空间上查询数据是否已经缓存,如果缓存,更新最后使用时间并把数据返回给用户;如果没有缓存,需从数据文件上直接读取,并判断缓存空间是否足够放此数据,如果缓存空间不够,需把缓存空间上的数据按LFU算法,把最久没使用的数据替换出去,用于最新的数据的缓存,缓存操作完成后,更新最后使用时间并把数据返回给用户,从而实现数据的查询操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510830217.X/1.html,转载请声明来源钻瓜专利网。





