[发明专利]一种基于Flink的数据流多向处理系统在审

专利信息
申请号: 201811373337.1 申请日: 2018-11-19
公开(公告)号: CN109710731A 公开(公告)日: 2019-05-03
发明(设计)人: 李志强;石波;胡佳;谢小明;丁卫星;徐晶 申请(专利权)人: 北京计算机技术及应用研究所
主分类号: G06F16/332 分类号: G06F16/332;G06F9/54
代理公司: 中国兵器工业集团公司专利中心 11011 代理人: 王雪芬
地址: 100854*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多向 数据流处理系统 数据流 处理系统 持久化 数据处理能力 数据实时处理 处理业务 传统算法 分析效率 高可靠性 高扩展性 高效组合 快速存储 数据丢失 整体能力 单节点 多业务 可升级 快速性 数据源 磁盘 存储 概率 分析 表现 保证
【说明书】:

发明涉及一种基于Flink的数据流多向处理系统,涉及数据实时处理技术领域。本发明给出了一种基于Kafka/Flink/Elasticsearch的单消费者处理多业务的数据流处理系统,能够实时高效准确地处理大规模的数据。利用Kafka的高扩展性和高可靠性,可将多个数据源的数据准确地收集汇总,并且易于新增扩展;Kafka可进行持久化操作,将消息持久化到磁盘,极大地减少了数据丢失的概率。与Flink的高效组合,分布式可升级为多消费多向处理业务数据的形式,极大地扩展了flink作为消费者的数据处理能力,同时也保证了计算并存储的快速性。这一种基于flink单消费者数据流处理系统,既在单节点上有出色的表现,也能在分布式呈现惊人的分析效率,扩大了传统算法分向处理、分析范围和快速存储的整体能力。

技术领域

本发明涉及数据实时处理技术领域,具体涉及一种基于Flink的数据流多向处理系统。

背景技术

随着云时代的来临,大数据也吸引了越来越多的关注。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。Flink是一个针对流数据和批数据的分布式处理引擎。ElasticSearch是一个基于Lucene的搜索服务器,设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,使用方便。

云计算时代数据呈现出爆炸性增长的态势,各类系统都会产生大量日志,日志数据的规模GB数量级跃升到TB甚至PB这样的数量级。面对海量的日志,传统的日志处理系统框架已经无法满足目前的需求。同时系统业务对日志、业务数据等处理的实时性需求也逐渐提高。传统的流数据处理框架其吞吐量和容错性存在先天的缺陷,不再适用于目前类似于互联网这类行业的高速扩展的业务需求。因此对于流式数据的处理,以及多业务需求中快速存储的问题,需要设计一种数据流处理系统,准确并且实时地计算和处理相关业务数据,加速系统的运算能力。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是:如何设计一种数据流处理系统,准确并且实时地计算和处理相关业务数据,加速系统的运算能力。

(二)技术方案

为了解决上述技术问题,本发明提供了一种基于Flink的数据流多向处理系统,包括数据缓存模块、数据多向处理模块和数据存储模块;

所述数据缓存模块用于缓存从不同的源收集的数据,并转发给数据多向处理模块;所述数据多向处理模块用于接收来自数据缓存模块的数据,根据多业务需求把日志流进行多纬度处理分析,再把对应的日志流发送给其对应的数据存储模块。

优选地,所述数据缓存模块采用Apache Kafka实现。

优选地,所述数据多向处理模块中使用flink-kafka连接器对Kafka的流数据进行消费处理,在flink中进行数据多层次,多流向的处理。

优选地,所述数据多向处理模块具体采用如下过程对Kafka的流数据进行消费处理:

初始化消费者:由连接器创建kafka的消费者,此处只创建一个消费者,以接收缓存在kafka的数据;

筛选并转换:创建过滤器,对数据源进行过滤,去除非法数据;创建转换器,对多种业务需求进行数据统一化格式转换处理;

多向处理:对同一个数据按照多种不同的处理方式进行处理,并行经过多种不同的业务逻辑,实现单消费者对数据的多方位分析:

第一种业务处理流程,实现峰值和热词的统计收集:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811373337.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top