[发明专利]基于海量数据的文件生成方法及系统在审

申请号：	201811250926.0	申请日：	2018-10-25
公开（公告）号：	CN109309726A	公开（公告）日：	2019-02-05
发明（设计）人：	安栋;王斌;宋先优;郭锦玉	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	H04L29/08	分类号：	H04L29/08;G06F9/50
代理公司：	深圳中一专利商标事务所 44237	代理人：	官建红
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于海量数据的文件生成方法及系统，包括：客户端向第一管理节点发送第一请求消息，携带N个数据块的存储路径和每个数据块所对应的任务类型，包括CPU密集型任务和I/O密集型任务；第一管理节点依次获取每个计算节点处理两类任务的处理能力，根据N个数据块的任务类型，向N个计算节点分别分配一个子任务，计算节点读取该数据块中的数据并对数据进行处理；客户端根据N个计算节点的数据处理结果，生成数据所对应的文件。通过spark集群中的多个计算节点对海量数据并行处理生成文件，且spark集群中的管理节点根据数据库所对应的任务类型将该数据块分配给处理该类型任务能力强的计算节点，在达到负载均衡的基础上提高了数据处理的速度。
搜索关键词：	计算节点数据块管理节点海量数据任务类型文件生成客户端集群读取数据处理结果数据块分配并行处理存储路径负载均衡请求消息任务能力生成数据生成文件数据处理数据库发送携带分配
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于海量数据的文件生成方法，其特征在于，该方法应用于计算引擎spark集群，spark集群中包括第一管理节点和多个计算节点，该方法包括：客户端向所述第一管理节点发送第一请求消息，所述第一请求消息用于请求将待处理的数据进行处理生成文件，所述数据由N个数据块组成，所述第一请求消息中携带所述N个数据块中每个数据块的存储路径信息和每个数据块所对应的任务类型，所述任务类型包括中央处理器CPU密集型任务和输入输出I/O密集型任务，N为大于等于2的正整数；所述第一管理节点依次获取每个计算节点处理CPU密集型任务的处理能力和处理I/O密集型任务的处理能力；所述第一管理节点根据每个计算节点处理CPU密集型任务的处理能力和处理I/O密集型任务的处理能力，以及所述N个数据块所对应的任务类型，向N个计算节点分别分配一个子任务，每个子任务用于对一个数据块进行处理，每个子任务携带有一个数据块的路径信息，以使得所述计算节点根据接收到的子任务中的数据块的路径信息读取该数据块中的数据并对数据进行处理；所述客户端根据所述N个计算节点的数据处理结果，生成所述数据所对应的文件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811250926.0/，转载请声明来源钻瓜专利网。

上一篇：应用下载和更新方法、装置、计算机设备及存储介质
下一篇：一种SP远程访问实现方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于海量数据的文件生成方法及系统在审

专利文献下载