[发明专利]一种生成统计信息的方法、系统以及电子设备在审
申请号: | 201910230145.3 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110032565A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 赵裕众;陈骁 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 刘立升 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合并 统计信息 读取 电子设备 | ||
本说明书的一个或多个实施例公开了一种生成统计信息的方法,包括:读取被合并数据级中的数据和合并数据级中的数据;将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级;根据所述新的合并数据级中的数据和已有统计信息中的数据,在生成所述新的合并数据级的过程中进行生成新的统计信息的操作。
技术领域
本说明书实施例涉及数据库领域,尤其涉及一种生成统计信息的方法、系统以及电子设备。
背景技术
数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。
数据库中设置有优化器,数据库中的优化器通过代价模型来选择最优的执行计划。而代价模型的计算需要依赖行数、列的不同值的个数、列的最大值、列的最小值等统计信息,但是统计信息的生成是一个非常耗费资源的过程。
传统数据库的统计信息的生成一般是一个独立的流程,通过SQL命令、定时任务或者关系表的更新量超过了设定的阈值来触发,然后生成统计信息。此外,在传统的统计信息的生成过程中一般需要遍历或者采样一遍数据库中的全部数据,虽然通常都会设置一个采样比例来降低开销,但是还需要一种更好的生成统计信息的方法。
发明内容
为了解决以上技术问题,本说明书实施例的主要目的在于提供一种生成统计信息的方法、系统以及电子设备,以解决现有技术中需要读取数据库中的全部数据才能得到统计信息,从而带来的消耗较多系统资源的技术问题。
本说明书的一个或多个实施例的技术方案是通过以下方式实现的:
本说明书实施例提供一种生成统计信息的方法,包括:
读取被合并数据级中的数据和合并数据级中的数据;
将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级;
根据所述新的合并数据级中的数据和已有统计信息中的数据,在生成所述新的合并数据级的过程中进行生成新的统计信息的操作。
本说明书实施例提供一种生成统计信息的方法,所述将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级的步骤,具体包括:
将读取的被合并数据级中的主键值与合并数据级中的主键值进行对比;
根据对比结果将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级。
本说明书实施例提供一种生成统计信息的方法,所述根据对比结果将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级,具体包括:
当所述被合并数据级中的主键值与所述合并数据级中的主键值相同时,读取所述被合并数据级中与所述合并数据级中的主键值相同的主键值对应行的数据,并将所述被合并数据级中与所述合并数据级中的主键值相同的主键值对应行的数据,更新至所述合并数据级中;
将所述合并数据级中主键值及其对应行更新后的数据,作为所述新的合并数据级中与所述合并数据级中的主键值相同的主键值及其对应行的数据;其中,更新一个所述合并数据级中主键值对应行的数据的同时,在所述新的合并数据级中生成与所述合并数据级中主键值相同的主键值及其对应行的数据。
本说明书实施例提供一种生成统计信息的方法,所述根据对比结果将读取的被合并数据级中的数据和合并数据级中的数据进行合并,在所述合并的过程中生成新的合并数据级,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910230145.3/2.html,转载请声明来源钻瓜专利网。