[发明专利]一种统计类数据表的生成方法和装置有效
申请号: | 201711376903.X | 申请日: | 2017-12-19 |
公开(公告)号: | CN109933759B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 王永伟;王赛;江岚;谢锋;张谦;邓中华;董芳英 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06F16/22;G06F16/2458 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统计 数据表 生成 方法 装置 | ||
本申请实施例提供了一种统计类数据表的生成方法和装置,所述方法包括:确定生成统计类数据表的统计粒度,所述统计类数据表包括统计类逻辑表和统计类物理表;获取生成所述统计类数据表的统计指标;根据所述统计粒度和统计指标,生成与所述统计粒度相对应的统计类逻辑表;基于所述统计类逻辑表,生成统计类物理表,提高了统计类数据表的生成效率。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种统计类数据表的生成方法、一种统计类数据表的查询方法、一种统计类数据表的生成装置和一种统计类数据表的查询装置。
背景技术
数据仓库Data Warehouse是一种面向主题的、集成的、相对稳定并能够反映数据的历史变化的集合。数据仓库可以为企业不同级别的决策制定过程提供多种类型的数据支持。通常,数据仓库在用于高管决策和运营支持等方面时主要是通过创建数据仓库的统计类表来实现的。
统计类表是在源数据表或对源数据表进行处理后获得的表的基础上进一步加工得到的。目前,创建数据仓库的统计类表主要包括两种方式。一种是逻辑模型+物理模型的方式,通过设计统计类表的逻辑模型,进而开发得到相应的物理模型;另一种则是自由模式的方式,不需要进行模型设计或者只需要进行少量的模型设计,然后基于SQL、MR或其他脚本语言进行物理表或文件的加工处理,直接产出相关物理表。
在采用逻辑模型+物理模型的方式创建统计类表时,由于逻辑模型和物理模型之间是相互分离的,每次业务逻辑的变更都需要同时对逻辑模型和物理模型进行变更并修改物理模型的开发代码。通常,修改逻辑模型对于物理模型的修改和代码开发而言一般是非必要的,频繁的修改逻辑模型会降低开发的效率。但是,如果用户只修改物理模型和开发代码,也会导致逻辑模型和物理模型之间的差异越来越大,使得逻辑模型不可用。而采用自由模式的方式创建统计类表虽然能够避免前一种方式中模型设计带来的一系列问题,但按自由模式创建的统计类表的可复用性和可维护性却较差。在用户使用数据时,首先要从大量的物理化表中找到所需要的字段或者手工生成物理化大宽表,而且生成的物理化大宽表需要不断地进行维护才能满足相应的需求。因此,无论是采用逻辑模型+物理模型的方式还是自由模式的方式创建统计类表,操作起来都十分繁琐且效率低下。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种统计类数据表的生成方法、一种统计类数据表的查询方法、一种统计类数据表的生成方法和相应的一种统计类数据表的查询装置。
为了解决上述问题,本申请公开了一种统计类数据表的生成方法,包括:
确定生成统计类数据表的统计粒度,所述统计类数据表包括统计类逻辑表和统计类物理表;
获取生成所述统计类数据表的统计指标;
根据所述统计粒度和统计指标,生成与所述统计粒度相对应的统计类逻辑表;
基于所述统计类逻辑表,生成统计类物理表。
为了解决上述问题,本申请公开了一种统计类数据表的生成方法,包括:
接收生成统计类数据表的请求,所述统计类数据表包括统计类逻辑表和统计类物理表;
从所述请求中提取出生成所述统计类数据表的统计粒度和统计指标;
根据所述统计粒度,生成与所述统计粒度相对应的统计类逻辑表;
基于所述统计指标和统计类逻辑表,生成统计类物理表;
展现所述统计类逻辑表。
为了解决上述问题,本申请公开了一种统计类数据表的查询方法,包括:
展现统计类数据表的查询界面或查询接口;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711376903.X/2.html,转载请声明来源钻瓜专利网。