[发明专利]云平台数据集成管理系统和方法有效
申请号: | 201611084553.5 | 申请日: | 2016-11-30 |
公开(公告)号: | CN106599116B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 衡星辰;陈丰;张诗军;甘杉;范国勇 | 申请(专利权)人: | 中国南方电网有限责任公司;广州博纳信息技术有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 罗伟添 |
地址: | 510670 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平台 数据 集成 管理 系统 方法 | ||
本发明公开了一种云平台数据集成管理系统和方法,其中,云平台数据集成管理系统,包括基础层和应用层,所述基础层为应用层提供应用支撑;所述基础层,包括元数据管理模块和系统管理模块,所述应用层,包括数据流管理模块、云资源管理模块、计划管理模块、监控台、文件生成器和智能执行引擎。实现高效率、低成本且实施难度低的优点。
技术领域
本发明涉及数据处理领域,尤其涉及云平台数据集成管理系统和方法。
背景技术
随着大数据时代的来临,企业的数据量越来越大,时效性要求越来越高。现有的ETL性能上越来越难满足企业的要求,导致数据延时以及数据不全,影响企业决策分析以及跨部门的协作,成为企业未来发展的瓶颈。现阶段企业需要拥有一套成熟、高效、稳定且灵活的ETL工具来协助企业搬运数据,实现数据即时共享,支撑企业基于大数据的决策分析。
目前大部分企业都已开展了提升ETL效率的项目。其中解决方案如下:
1)沿用原有的软件,重新购置更高性能的机器,满足现有的需求。
2)并行执行ETL任务,同时打开多台机器,按经验设置ETL任务的执行时间安排执行计划。
3)将巨大数据的库表进行分区,并对每个分区安排执行任务,并发对数据进行数据迁移。
上述解决方案存在以下缺陷:
1、成本高:重新购置机器,成本高,专业ETL技术人员成本高。
2、效率低:虽然能实现并行,但并不能完全利用每台机器的性能。
3、实施难度大:对实施人员技术要求较高,需要有专业的ETL技术和经验,大大增加用人成本与人员的依赖,增大人员流动导致的项目风险。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种云平台数据集成管理系统和方法,从而实现高效率、低成本且实施难度低的优点。
本发明的目的采用以下技术方案实现:
一种云平台数据集成管理系统,包括基础层和应用层,所述基础层为应用层提供应用支撑;
所述基础层,包括元数据管理模块和系统管理模块,
所述元数据管理模块:管理数据源和目标数据库的数据,
所述系统管理模块:管理集成管理系统的基础信息;
所述应用层,包括数据流管理模块、云资源管理模块、计划管理模块、监控台、文件生成器和智能执行引擎,
所述数据流管理模块:对来自数据源的数据流进行执行文件配置和执行模板管理;
所述文件生成器:通过执行文件配置与执行模板结合,批量生成数据抽取执行文件;
所述云资源管理模块:管理云服务器集群中所有的服务器资源,并通过智能策略配置对服务器资源进行智能的自动分配,从而生成服务器清单和服务器分配策略文件;
所述计划管理模块:对数据抽取执行文件进行管理规划,从而生成任务执行计划文件;
所述智能执行引擎:根据任务执行计划文件、数据抽取执行文件、服务器清单和服务器分配策略文件完成数据抽取任务分配。
优选的,还包括,监控台:监控云平台数据集成管理系统的运行信息。
优选的,所述运行信息包括,数据抽取计划的执行信息、数据抽取的错误信息和服务器资源信息。
优选的,所述智能执行引擎完成数据抽取任务分配:具体为,依据任务执行计划文件、数据抽取执行文件和服务器清单作为参数,通过粒子群算法实现自动分配服务器资源与数据抽取节点的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;广州博纳信息技术有限公司,未经中国南方电网有限责任公司;广州博纳信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611084553.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据保护方法、装置及终端
- 下一篇:一种茶学领域虚拟本体建模方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置