[发明专利]基于Hadoop的分布式数据仓库的构建方法在审
申请号: | 202210093431.1 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114490890A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 荀皓;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/27 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 程宗德 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于Hadoop的分布式数据仓库的构建方法,其中,Flume用于对目标数据进行采集,Hive用于对采集得到的数据进行计算,从而形成离线的、分布式的数据仓库,Zookeeper用于对数据仓库的各类组件进行协调服务,并且数据仓库基于预定的分层模型被分为了多层,因此,通过本发明的构建方法,能够基于Hadoop文件系统搭建离线的、分布式的数据仓库,并且通过对数据仓库进行分层,能够将原始的杂乱无章的大量数据进行聚合整理,并可根据业务需要得到多个数据指标,从而能够使大型企业更方便、高效地对其海量数据进行有效的管理。 | ||
搜索关键词: | 基于 hadoop 分布式 数据仓库 构建 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210093431.1/,转载请声明来源钻瓜专利网。