[发明专利]一种数据的动态加载处理方法及系统有效
申请号: | 201410252721.1 | 申请日: | 2014-06-09 |
公开(公告)号: | CN104008178B | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 江军华;黄兆斌;李卓辉;徐炜 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/50 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 汤在彦 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 动态 加载 处理 方法 系统 | ||
技术领域
本发明关于计算机数据技术领域,特别是关于计算机数据的抽取、转换、装载技术,具体的讲是一种数据的动态加载处理方法及系统。
背景技术
数据仓库是一个庞大的数据海洋,海量的数据都是通过ETL(Extract Transform Load、数据抽取、转换、装载)任务来完成加载转换的。随着计算机技术的日益发展,数据仓库的规模不断壮大,纳入的数据源与日俱增,其时效性也参差不齐。
现有技术中的ETL任务,是将进相同数据仓库模型实体的不同源表全部组合在同一个加载任务中,仅当该任务的所有上游源表到齐后,才开始加载转换。因此,通过现有技术中的ETL任务来完成加载转换存在如下问题:
1、加载任务若集中在一段时间内爆发,爆发前上游数据到达却不加载,会导致系统空闲;爆发后若系统繁忙压力较大,会导致加载速度受限于系统资源。
2、涉及批量中关键路径上的作业,只能通过固定拆分任务实现调整,不够自动、灵活。
因此,如何提出一种基于数据的动态加载处理的方案,其能够克服数据仓库ETL任务内容固定组合所带来的不利影响是本领域亟待解决的技术难题。
发明内容
为了克服现有技术存在的数据仓库ETL任务内容固定组合所带来的不利影响的技术问题,本发明提供了一种数据的动态加载处理方法及系统,将原ETL任务中的源表——目标表关系视为一个原子任务,对其进行动态组合,实现较优原子组合,以充分利用系统资源,提高ETL效率,提高数据仓库对外数据服务效益。
本发明的目的之一是,提供一种数据的动态加载处理方法,包括:获取当前系统的待加载的原子任务;根据所述的原子任务生成组合任务;动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率;根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务。
本发明的目的之一是,提供了一种数据的动态加载处理系统,所述的系统具体包括:原子任务获取装置,用于获取当前系统的待加载的原子任务;组合任务生成装置,用于根据所述的原子任务生成组合任务;即时使用率采集装置,用于动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率;组合任务加载装置,用于根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务。
本发明的有益效果在于,提供了一种数据的动态加载处理方法及系统,通过将原ETL任务中的源表——目标表关系视为一个原子任务,对其进行动态组合,使得ETL任务具备较高的灵活性,实现原子任务较高层次的复用度,动态组合任务加载,做到系统资源得以充分的利用,最大程度地优化提升数据仓库对外提供服务质量。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据的动态加载处理方法的流程图;
图2为图1中的步骤S102的具体流程图;
图3为图1中的步骤S104的实施方式一的具体流程图;
图4为图1中的步骤S104的实施方式二的具体流程图;
图5为图1中的步骤S104的实施方式三的具体流程图;
图6为图3中的步骤S304的具体流程图;
图7为图3中的步骤S305的具体流程图;
图8为本发明提供的一种数据的动态加载处理方法在具体实例中的流程图;
图9为本发明实施例提供的一种数据的动态加载处理系统的结构框图;
图10为本发明实施例提供的一种数据的动态加载处理系统中组合任务生成装置200的结构框图;
图11为本发明实施例提供的一种数据的动态加载处理系统中组合任务加载装置400的实施方式一的结构框图;
图12为本发明实施例提供的一种数据的动态加载处理系统中组合任务加载装置400的实施方式二的结构框图;
图13为本发明实施例提供的一种数据的动态加载处理系统中组合任务加载装置400的实施方式三的结构框图;
图14为本发明实施例提供的一种数据的动态加载处理系统中资源确定模块404的结构框图;
图15为本发明实施例提供的一种数据的动态加载处理系统中加载模块405的结构框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410252721.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置