[发明专利]一种适用流式处理的大规模数据连续分析系统有效
申请号: | 201110450268.1 | 申请日: | 2011-12-29 |
公开(公告)号: | CN102546247A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 金海;赵峰;袁平鹏;张冬洁 | 申请(专利权)人: | 华中科技大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种适用流式处理的大规模数据连续分析系统,包括元数据管理模块,用于管理数据表和数据库的元信息;查询计划生成模块,用于接收查询请求,生成优化的查询计划;数据导入任务生成模块,用于接收数据导入请求,生成数据导入MR作业集;增量处理模块,用于并行地增量地提交Hadoop系统数据导入和查询作业;MR消息处理模块,用于接收Hadoop系统的Map或Reduce函数的结果,将结果输出给Reduce端或下一个作业;数据库连接模块,用于作为Hadoop系统和数据库之间的接口。本发明使用Hadoop系统将各节点中的数据库有机组织在一起,并发地执行数据导入和数据查询,使用管道技术改进MapReduce(MR)执行流程,使得数据查询以连续的流水的方式执行,大大缩短了大规模数据分析的时间。 | ||
搜索关键词: | 一种 适用 处理 大规模 数据 连续 分析 系统 | ||
【主权项】:
一种适用流式处理的大规模数据连续分析系统,包括元数据管理模块、查询计划生成模块、数据导入任务生成模块、增量处理模块、MR消息处理模块和数据库连接模块;所述元数据管理模块,用于存储配置文件、源数据模式信息、数据导入模式信息、数据库节点信息和数据库连接信息;所述查询计划生成模块,用于接收用户查询请求,依据所述元数据管理模块的源数据模式信息解析用户查询请求,依据查询解析结果生成查询计划传送给增量处理模块,并将所述查询解析结果传送给数据导入任务生成模块;所述数据导入任务生成模块,用于接收用户数据导入请求,依据所述用户数据导入请求和元数据管理模块提取源数据信息,生成配置文件,配置文件包含分配给源数据的数据库节点信息以及数据库连接信息;接收所述查询计划生成模块的查询解析结果,依据所述查询解析结果和源数据模式确定数据导入模式,数据导入模式只包含与查询相关的属性以及用于标识数据导入进度的增量标识属性,将配置文件、源数据模式和数据导入模式信息存储于所述元数据管理模块;依据数据导入模式和配置文件生成Hapdoop系统可执行的数据导入MR作业集,将数据导入MR作业集传送给增量处理模块;所述增量处理模块,用于接收查询计划生成模块的查询计划和数据导入任务生成模块的数据导入MR作业集;所述增量处理模块将数据导入MR 作业集提交给Hapdoop系统,Hapdoop系统调用所述数据库连接模块执行数据导入MR作业集;所述增量处理模块结合所述元数据管理模块中的配置文件将所述查询计划编译成Hapdoop系统可执行的查询MR作业集,每当导入数据达到预定量后,所述增量处理模块就向Hapdoop系统提交一次查询MR作业集,Hapdoop系统调用所述数据库连接模块针对导入的这一部分数据执行查询MR作业集;MR消息处理模块,嵌入在Hadoop系统中,用于使Hadoop系统在执行数据导入或查询MR作业集时,将Map端产生的中间数据推送给对应的Reduce端,将Reduce端产生的执行结果推送给下一任务的Map端;数据库连接模块,用于提供Hadoop系统与数据库之间的接口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110450268.1/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置