[发明专利]通用大数据实时处理开发平台及其数据处理方法在审
申请号: | 201811528297.3 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109684377A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 赵晓炳 | 申请(专利权)人: | 深圳市思迪信息技术股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2453 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 任哲夫 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异构数据源 批量数据 流数据 处理事件 开发平台 实时处理 数据处理 大数据 调用 数据库 存储 数据采集模块 数据处理模块 数据处理系统 数据传输模块 查询模块 存储模块 服务模块 开发效率 业务应用 应用程序 通用 构建 预设 查询 输出 监测 发布 协调 开发 服务 | ||
1.一种通用大数据实时处理开发平台,其特征在于,所述通用大数据实时处理开发平台包括:
数据采集模块,用于从数据库中获取多个异构数据源;
数据传输模块,所述数据传输模块与数据采集模块电连接,用于将多个异构数据源进行发布;
数据处理模块,所述数据处理模块与数据传输模块电连接,用于分别对多个异构数据源中的批量数据及流数据进行处理并调用相应的预设数据库,以构建业务应用,其中,所述数据处理模块预设有应用数据库;
存储模块,所述存储模块与数据处理模块电连接,用于对经处理的批量数据及流数据进行存储;
输出查询模块,所述输出查询模块与存储模块电连接,用于对存储的批量数据及流数据进行查询;
应用程序协调服务模块,所述应用程序协调服务模块分别与数据传输模块、数据处理模块、存储模块及输出查询模块电连接,用以监测各模块的处理事件,以在某一处理事件异常时,调用相应的服务来处理对应的数据。
2.如权利要求1所述的通用大数据实时处理开发平台,其特征在于,所述数据采集模块采集的数据类型包括MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS及ODPS中至少一种,且所述数据采集模块具体为阿里开源DataX。
3.如权利要求2所述的通用大数据实时处理开发平台,其特征在于,所述数据传输模块采用Kafka集群,以将多个异构数据源进行分布式发布。
4.如权利要求3所述的通用大数据实时处理开发平台,其特征在于,所述数据处理模块具体为通用实时计算引擎Spark集群,以构建多个并行应用并调用对应的应用数据库,并分别对多个异构数据源中的批量数据及流数据进行并行处理。
5.如权利要求4所述的通用大数据实时处理开发平台,其特征在于,所述应用数据库包括SQL、DataFrames、MLlib、GraphX及Spark集群Streaming中的至少一种。
6.如权利要求5所述的通用大数据实时处理开发平台,其特征在于,所述数据处理模块具体为列式存储器Kudu集群,以对经并行处理的批量数据及流数据分别进行存储。
7.如权利要求6所述的通用大数据实时处理开发平台,其特征在于,所述输出查询模块具体为分布式查询引擎Impala集群,以对存储的批量数据及流数据进行并发查询。
8.如权利要求7所述的通用大数据实时处理开发平台,其特征在于,所述应用程序协调服务模块具体为分布式应用程序协调服务Zookeeper。
9.一种通用大数据实时处理开发平台的数据处理方法,其特征在于,所述通用大数据实时处理开发平台的数据处理方法包括:
S10、从数据库中获取多个异构数据源;
S20、将多个异构数据源进行发布;
S30、分别对多个异构数据源中的批量数据及流数据进行处理并调用相应的预设数据库,以构建业务应用;
S40、对经处理的批量数据及流数据进行存储;
S50、对存储的批量数据及流数据进行查询;
S60、监测步骤S20-S50中对异构数据源处理得到的处理事件,以在某一处理事件异常时,调用相应的服务处理对应的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市思迪信息技术股份有限公司,未经深圳市思迪信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811528297.3/1.html,转载请声明来源钻瓜专利网。