[发明专利]基于Storm的流计算即时处理系统在审
申请号: | 201610502488.7 | 申请日: | 2016-06-28 |
公开(公告)号: | CN107545014A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 田娜;杨庆双;刘金华;贾诗乐;徐俊;刘建宇;崔雨玲;杨宇全;曹北建 | 申请(专利权)人: | 国网天津市电力公司;国家电网公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 天津才智专利商标代理有限公司12108 | 代理人: | 王顕 |
地址: | 300010*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Storm的流计算即时处理系统,其包括四个部分,第一部分是数据接入该部分从前端业务系统获取数据;第二部分是最重要的Storm实时处理部分,数据从接入层接入,经过实时处理后传入数据落地层;第三部分为数据落地层,该部分指定了数据的落地方式;第四部分元数据管理器。通过对实际业务需求的调研以及算法的研究,形成满足实际业务的数据处理规则库,根据用户预定义的事件模型,实时高效地检测基本事件,直到组成事件模型的所有基本事件被检测到。本发明适用于处理对符合电网业务数据特征的数据流实时性要求极高的复杂分析计算,可达到加快数据分析速度、实时分析计算的目的。 | ||
搜索关键词: | 基于 storm 计算 即时 处理 系统 | ||
【主权项】:
一种基于Storm的流计算即时处理系统,其特征在于:包括四个部分,第一部分为数据接入层,数据接入该部分从前端业务系统获取数据,数据接入层:该部分有多种数据收集方式,包括使用消息队列MetaQ,直接通过网络Socket传输数据,前端业务系统专有数据采集API、对Log的定时监控,在数据接入层,应用动态实时数据捕获技术、增量数据捕获技术,结合数据捕获过程对生产终端影响降低方法,实现在尽可能降低生产终端影响的前提下,灵活捕获数据;第二部分为Storm实时处理层,数据从数据接入层接入,经过实时处理后传入数据落地层,Storm实时处理层:其中Nimbus负责资源分配和任务调度,Supervisor负责接受nimbus分配的任务,启动和停止属于自己管理的worker进程,Worker在运行具体处理组件逻辑的进程,worker中每一个spout/bolt的线程称为一个task,具体业务需求:条件过滤、中间值计算、求topN、推荐系统、分布式RPC、热度统计,在Storm实时处理层,基于流计算引擎,实现按照预定义的规则对数据进行处理并形成计算结果;第三部分为数据落地层,该部分指定了数据的落地方式,数据落地层包括MetaQ、Mysql、HDFS和Lustre,MetaQ:部分数据在经过实时处理后写入MetaQ中,后端业务系统从MetaQ中获取数据,Mysql:作为数据落地的存储对象,适合中小量数据存储,HDFS:HDFS及基于Hadoop的分布式文件系统,用于基于HDFS搭建出来的日志分析系统与Storm的连接,Lustre:可为数据提供一个较大的数据目录,并用于数据归档保存,在数据落地层,结合基于SQL的数据实时查询技术以及数据展现控件技术,实现计算结果的多维度、形式丰富的展现,支撑高级电网业务应用,基于分布式存储技术对落地数据与计算结果进行存储;第四部分元数据管理器,其为系统的统一协调组件,用于指导前端业务系统的数据写入、通知实时处理部分数据类型及其他数据描述、指导数据落地。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司;国家电网公司,未经国网天津市电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610502488.7/,转载请声明来源钻瓜专利网。