[发明专利]分区表中的唯一值估计有效
申请号: | 201210445053.5 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103177061A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | L·弗里克;S·Y·黄 | 申请(专利权)人: | SAP股份公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分区表 中的 唯一 估计 | ||
1.一种包括存储指令的机器可读介质的计算机程序产品,当所述指令由至少一个可编程处理器执行时,使得所述至少一个可编程处理器执行下列操作,包括:
应用估计算法以生成代表数据库表的列中的数据的唯一性度量,所述列被跨越多个数据分区来划分;
通过比较所述唯一性度量与阈值,将所述列分类为有类别的或无类别的;
将第一估计因子和第二估计因子之一分配给所述列,如果所述列被分类为有类别的,则所述分配包括第一估计因子,如果所述列被分类为无类别的,则所述分配包括第二估计因子,第二估计因子大于第一估计因子;
计算对在所述数据库表执行数据库操作所需的系统资源的成本估计,所述成本估计包括使用分配的第一估计因子或第二估计因子以及作为估计函数的输入的所述表中的行数而确定的、跨越所述多个数据分区中所有分区的所述列中的不同值的估计的总数;并且
改进所述成本估计。
2.如权利要求1所述的计算机程序产品,其中,改进所述成本估计包括使用在开发至少部分操作计划中的成本估计,用于执行涉及按照最优次序的数据库表的至少一个列和其它列的一个或多个数据库操作,经由与计算系统或设备相关联的显示设备显示成本估计,发送包含成本估计的电子消息给用户或者另一个机器,并且生成包括成本估计的报告。
3.如权利要求2所述的计算机程序产品,其中,所述一个或多个数据库操作包含联接。
4.如权利要求1所述的计算机程序产品,其中,所述估计算法包括:
选择多个数据分区中的一个数据分区;
查询所选择的数据分区的字典有关在所选择的数据分区中的所述列中唯一值的总数,所述字典包括在所选择的数据分区中的所述列的唯一值的列表;
计算唯一值的总数与所选择的数据分区中包含的所述列的行数的比值;
假定所述比值代表了多个数据分区中所有其它数据分区中的唯一值的分布;以及
返回所计算的比值作为唯一性度量。
5.如权利要求1所述的计算机程序产品,其中,所述估计算法包括:
查询字典有关多个数据分区的两个或更多个数据分区中的每一个数据分区,所述字典包括所述两个或更多个数据分区中的每一个数据分区中的所述列的唯一值的列表,所述查询包括请求随机采样,所述随机采样包括有关所述两个或更多个数据分区中的每一个数据分区的所述列中的预设数量的唯一值;
比较有关两个或更多个数据分区中的每一个数据分区的从字典返回的所述随机采样;以及
返回所述唯一性度量作为随机采样之间的相异程度。
6.如权利要求1所述的计算机程序产品,其中,所述估计算法包括:
请求来自多个数据分区的一个或多个所选择的数据分区中的每一个数据分区的字典返回具有相同的特定大小的各自的Bloom过滤器,每一个字典包括其各自的数据分区中的所述列的唯一值的列表;以及
基于从所述一个或多个所选择的数据分区中返回的Bloom过滤器被填充的程度来返回所述唯一性度量。
7.一种系统,包括:
至少一个可编程的处理器;以及
存储指令的机器可读介质,所述指令在由至少一个处理器运行时,使得至少一个可编程处理器执行以下操作,包括:
应用估计算法以生成代表数据库表的列中的数据的唯一性度量,所述列被跨越多个数据分区来划分;
通过比较所述唯一性度量与阈值,将所述列分类为有类别的或无类别的;
将第一估计因子和第二估计因子之一分配给所述列,如果所述列被分类为有类别的,则所述分配包括第一估计因子,如果所述列被分类为无类别的,则所述分配包括第二估计因子,第二估计因子大于第一估计因子;
计算对在所述数据库表执行数据库操作所需的系统资源的成本估计,所述成本估计包括使用分配的第一估计因子或第二估计因子以及作为估计函数的输入的所述表中的行数而确定的、跨越所述多个数据分区中所有分区的所述列中的不同值的估计的总数;并且
改进所述成本估计。
8.如权利要求7所述的系统,其中,改进所述成本估计包括使用在开发至少部分操作计划中的成本估计,用于执行涉及按照最优次序的数据库表的至少一个列和其它列的一个或多个数据库操作,经由与计算系统或设备相关联的显示设备显示成本估计,发送包含成本估计的电子消息给用户或者另一个机器,并且生成包括成本估计的报告。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP股份公司,未经SAP股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210445053.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于射频技术的无线识别系统
- 下一篇:捷联式舰船惯性姿态基准通用维修平台