[发明专利]基于HDFS不同数据源的数据处理方法在审
申请号: | 202011592382.3 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112506888A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 宋玉凝;郭长营;王楠楠 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/242;G06F16/2458;G06F16/28 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hdfs 不同 数据源 数据处理 方法 | ||
本发明公开了一种基于HDFS不同数据源的数据处理方法,属于数据处理技术领域,本发明要解决的技术问题为如何能够实现来自不同数据源数据的处理,满足各种类型数据源的适配,更加灵活且功能多样,采用的技术方案为:该方法是在大数据集群的节点内开发、部署应对不同数据源的引擎,将不同数据源接入不同节点,分别执行引擎对数据进行数据处理操作,并与关系型数据库的数据汇总,将汇总后的数据后续处理后统一输出,实现在同一大数据集群中处理不同类型的数据的需求。
技术领域
本发明涉及数据处理技术领域,具体地说是一种基于HDFS不同数据源的数据处理方法。
背景技术
Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是ApacheHadoop Core项目的一部分。HDFS有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。
数据源是指数据库应用程序所使用的数据库或者数据库服务器。数据源(DataSource)顾名思义,数据的来源,是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件系统中找到文件一样,通过提供正确的数据源名称,你可以找到相应的数据库连接。
通常数据处理系统应对的是某一种数据源中的数据,如存储在HDFS(Hadoop分布式文件系统)集群中的数据。针对不同种类的数据源,数据处理系统应有不同的结构。故如何能够实现来自不同数据源数据的处理,满足各种类型数据源的适配,更加灵活且功能多样是目前亟待解决的技术问题。
发明内容
本发明的技术任务是提供一种基于HDFS不同数据源的数据处理方法,来解决如何能够实现来自不同数据源数据的处理,满足各种类型数据源的适配,更加灵活且功能多样的问题。
本发明的技术任务是按以下方式实现的,一种基于HDFS不同数据源的数据处理方法,该方法是在大数据集群的节点内开发、部署应对不同数据源的引擎,将不同数据源接入不同节点,分别执行引擎对数据进行数据处理操作,并与关系型数据库的数据汇总,将汇总后的数据后续处理后统一输出,实现在同一大数据集群(Hadoop)中处理不同类型的数据的需求。
作为优选,在大数据集群的节点内开发、部署应对不同数据源的引擎时,引入Query语句,用于查询大数据集群中的数据。
更优地,所述大数据集群中单个节点的数据处理过程具体如下:
(1)、执行数据处理引擎;
(2)、获取计算机可执行程序;
(3)、执行计算机可执行程序;
(4)、从外部数据源获取;
(5)、存储获取到的数据;
(6)、分别对不同数据源的数据上运行数据处理操作。
更优地,所述关系型数据库包括RDBMS和RDMS。
更优地,RDBMS的数据流流向具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592382.3/2.html,转载请声明来源钻瓜专利网。