[发明专利]一种数据处理方法及装置在审
申请号: | 201610490911.6 | 申请日: | 2016-06-28 |
公开(公告)号: | CN107545005A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 蒋文 | 申请(专利权)人: | 华为软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 冯艳莲 |
地址: | 210012 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种数据处理方法及装置,用以解决现有技术的分布式数据系统计算效率低的问题。该方法为一个节点服务器针对一个数据处理指令进行数据处理过程中,可以从至少一个数据源中获取待处理数据,将获取的待处理数据并拆分,并将拆分后的多个部分待处理数据,以及数据处理指令对应的查询计划分布至多个节点服务器(包含所述节点服务器),实现分布式关联计算,因此,该方法可以将原来由一个节点服务器处理的待处理数据的计算压力分解到多个节点服务器上,实现了节点服务器的计算能力的横向扩展,且节点服务器可以从多个数据源中获取待处理数据,使其计算能力不受限于数据源的I/O能力,提高了分布式数据系统的计算效率。 | ||
搜索关键词: | 一种 数据处理 方法 装置 | ||
【主权项】:
一种数据处理方法,其特征在于,包括:第一节点服务器接收到数据处理指令后,根据所述数据处理指令生成查询计划,并将所述查询计划发送至至少一个第二节点服务器,所述查询计划用于指示所述第一节点服务器以及所述至少一个第二节点服务器对待处理数据的进行处理;所述第一节点服务器根据所述查询计划,确定所述待处理数据所处的至少一个数据源,并从所述至少一个数据源中获取所述待处理数据;所述第一节点服务器获取所述待处理数据的分布规则,并按照所述分布规则,对所述待处理数据进行拆分,生成多个部分待处理数据;以及将所述多个部分待处理数据分布至所述第一节点服务器和所述至少一个第二节点服务器中;所述第一节点服务器根据所述查询计划以及分布至自身的部分待处理数据,生成第一运算结果;所述第一节点服务器获取所述至少一个第二节点服务器中每个第二节点服务器的第二运算结果,其中,任意一个第二节点服务器的第二运算结果为所述第二节点服务器根据所述查询计划以及分布至所述第二节点服务器的部分待处理数据生成的;所述第一节点服务器根据所述第一运算结果和所述每个第二节点服务器的第二运算结果,确定所述数据处理指令对应的运算结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为软件技术有限公司,未经华为软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610490911.6/,转载请声明来源钻瓜专利网。