[发明专利]基于zookeeper技术的数据分析方法及系统在审
申请号: | 201710201748.1 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106980678A | 公开(公告)日: | 2017-07-25 |
发明(设计)人: | 郝小锋 | 申请(专利权)人: | 温馨港网络信息科技(苏州)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京艾普利德知识产权代理事务所(特殊普通合伙)32297 | 代理人: | 陆明耀 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明揭示了基于zookeeper技术的数据分析方法及系统,确定主调度器和主生产者,各消费者向zookeeper注册节点信息及所在的消费者群组,并为其所在的消费者群组创建一个队列以及通知主调度器;主调度器控制主生产者将下载的待处理数据写入相应消费者本机以及将数据的本地存储路径注册到相应的队列里;主调度器通知各消费者进行数据处理;消费者获取数据进行处理,生成结构化/半结构化数据,导入到 Hadoop 集群中;通过hive工具离线分析,并将分析结果集插入到关系型数据库以及solr搜索引擎中。本发明可以利用Hadoop 系统进行数据分析而避免了繁杂的对关系型数据库的分表、拆表、合并等操作,简化了数据分析流程,又提供了更为方便地对任务进行调度、管理的系统。 | ||
搜索关键词: | 基于 zookeeper 技术 数据 分析 方法 系统 | ||
【主权项】:
基于zookeeper技术的数据分析方法,其特征在于:包括如下步骤:S1,所有调度器、生产者向zookeeper注册自身节点信息并启动,选举出主调度器、主生产者,各消费者向zookeeper注册自身节点信息及其所在的消费者群组,并为其所在的消费者群组创建一个队列以及通知主调度器;S2,主调度器根据各消费者汇报的队列,控制主生产者根据配置策略,将从已存在待处理数据的配置位置下载的待处理数据分别写入各消费者群组中的相应消费者本机,以及将待处理数据的本地存储路径注册到相应消费者对应的队列里;S3,主调度器通知各消费者群组中的消费者进行待处理数据处理;S4,各消费者按照指定原则获取待处理数据,进行解析、格式化处理,生成结构化/半结构化数据,并导入到Hadoop集群中;S5,通过hive工具根据业务场景离线分析S4步骤中生成的结构化/半结构化数据,并将分析结果集插入到关系型数据库以及solr搜索引擎中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温馨港网络信息科技(苏州)有限公司,未经温馨港网络信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710201748.1/,转载请声明来源钻瓜专利网。
- 上一篇:面向行业的主题搜索方法
- 下一篇:一种信息系统国产数据库迁移改造方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置