[发明专利]基于zookeeper技术的数据分析方法及系统在审

专利信息
申请号: 201710201748.1 申请日: 2017-03-30
公开(公告)号: CN106980678A 公开(公告)日: 2017-07-25
发明(设计)人: 郝小锋 申请(专利权)人: 温馨港网络信息科技(苏州)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京艾普利德知识产权代理事务所(特殊普通合伙)32297 代理人: 陆明耀
地址: 215000 江苏省苏州市*** 国省代码: 江苏;32
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明揭示了基于zookeeper技术的数据分析方法及系统,确定主调度器和主生产者,各消费者向zookeeper注册节点信息及所在的消费者群组,并为其所在的消费者群组创建一个队列以及通知主调度器;主调度器控制主生产者将下载的待处理数据写入相应消费者本机以及将数据的本地存储路径注册到相应的队列里;主调度器通知各消费者进行数据处理;消费者获取数据进行处理,生成结构化/半结构化数据,导入到 Hadoop 集群中;通过hive工具离线分析,并将分析结果集插入到关系型数据库以及solr搜索引擎中。本发明可以利用Hadoop 系统进行数据分析而避免了繁杂的对关系型数据库的分表、拆表、合并等操作,简化了数据分析流程,又提供了更为方便地对任务进行调度、管理的系统。
搜索关键词: 基于 zookeeper 技术 数据 分析 方法 系统
【主权项】:
基于zookeeper技术的数据分析方法,其特征在于:包括如下步骤:S1,所有调度器、生产者向zookeeper注册自身节点信息并启动,选举出主调度器、主生产者,各消费者向zookeeper注册自身节点信息及其所在的消费者群组,并为其所在的消费者群组创建一个队列以及通知主调度器;S2,主调度器根据各消费者汇报的队列,控制主生产者根据配置策略,将从已存在待处理数据的配置位置下载的待处理数据分别写入各消费者群组中的相应消费者本机,以及将待处理数据的本地存储路径注册到相应消费者对应的队列里;S3,主调度器通知各消费者群组中的消费者进行待处理数据处理;S4,各消费者按照指定原则获取待处理数据,进行解析、格式化处理,生成结构化/半结构化数据,并导入到Hadoop集群中;S5,通过hive工具根据业务场景离线分析S4步骤中生成的结构化/半结构化数据,并将分析结果集插入到关系型数据库以及solr搜索引擎中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温馨港网络信息科技(苏州)有限公司,未经温馨港网络信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710201748.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top