[发明专利]一种数据仓库构建方法及装置有效
申请号: | 201711376911.4 | 申请日: | 2017-12-19 |
公开(公告)号: | CN110019551B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 王永伟;王赛;江岚;谢锋;张谦;邓中华;董芳英 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据仓库 构建 方法 装置 | ||
本申请提供了一数据仓库构建方法和装置,涉及数据库技术领域。所述方法包括:提供逻辑模型;所述逻辑模型包括至少一个逻辑表的基础信息、针对所述逻辑表的属性、针对所述属性的执行逻辑、针对所述属性的关联维度;所述执行逻辑用于基于所述属性构建表时,从目标表获取所述属性需求的数据;根据所述逻辑模型构建数据仓库。本申请实现维度和执行逻辑结合的逻辑模型定义方式,ETL开发过程中不用关注如何生成物理表、也不用关注如何生成执行逻辑代码,只需要利用该逻辑模型即可构建数据仓库,因此可以节省ETL开发过程,提高效率,可维护性好。
技术领域
本申请涉及数据库技术领域,特别是涉及一种数据仓库构建方法及装置。
背景技术
数据仓库,英文名称为Data Warehouse,其是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它可以出于分析性报告和决策支持目的而创建,为需要进行数据分析的企业,提供指导业务流程改进、监视时间、成本、质量以及控制等。
在先技术中,数据仓库的构建有两大类方式:第一类,先定义逻辑模型,然后基于该逻辑模型生成物理表存储于数据仓库中。第二类,采用自由模式直接生成物理表存储于数据仓库中。对于第一类中,其逻辑模型可以采用 3NF(数据库构建的第三范式,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息,且需要满足第一范式和第二范式),还可以采用星型模型,该两种逻辑模型的维度表和事实表都是针对属性和关联维度之间的定义,在逻辑模型定义之后,还需要人工基于该逻辑模型生成相应的物理表。而第二类方式,不用逻辑模型或者很少用逻辑模型,其基于 SQL(StructuredQuery Language,结构化查询语言)其他脚本语言,直接产出物理表。
发明人在应用上述方案的过程中发现,第一类方式中,其逻辑模型和物理模型是分离的两个概念,逻辑模型仅用于指导ETL (Extract-Transform-Load,数据抽取、清洗、转换、装载)开发物理表的构建,还需要人工开发物理表,效率低,可维护性差,而第二类方式中,其由于很少不用或者很少用逻辑模型,直接用脚本语言产出物理表,可维护性差。
发明内容
鉴于上述问题,本申请实施例提供一种数据仓库构建方法,以通过包括少一个逻辑表的基础信息、针对所述逻辑表的属性、针对所述属性的执行逻辑、针对所述属性的关联维度的逻辑模型,构建数据仓库,解决在先技术中效率低、复用性、可维护性差问题。
相应的,本申请实施例还提供了一种数据仓库构建装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种数据仓库构建方法,包括:
提供逻辑模型;所述逻辑模型包括至少一个逻辑表的基础信息、针对所述逻辑表的属性、针对所述属性的执行逻辑、针对所述属性的关联维度;所述执行逻辑用于基于所述属性构建表时,从目标表获取所述属性需求的数据;
根据所述逻辑模型构建数据仓库。
相应的,本申请实施例还公开了一种数据仓库构建装置,包括:
模型提供模块,用于提供逻辑模型;所述逻辑模型包括至少一个逻辑表的基础信息、针对所述逻辑表的属性、针对所述属性的执行逻辑、针对所述属性的关联维度;所述执行逻辑用于基于所述属性构建表时,从目标表获取所述属性需求的数据;
构建模块,用于根据所述逻辑模型构建数据仓库。
相应的,本申请实施例还公开了一种装置,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行所述指令时,使得所述装置执行一种数据仓库构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711376911.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据仓库管理方法、装置及计算机设备
- 下一篇:用户关注状态更新的方法和装置