[发明专利]基于MapReduce模型的数据处理方法和设备有效
申请号: | 201710072197.3 | 申请日: | 2017-02-09 |
公开(公告)号: | CN108415912B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 路璐 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455;G06F16/27;G06F16/28;G06F16/182 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了一种基于MapReduce模型的数据处理方法和设备。所述方法在利用MapReduce模型实现SQL指令的处理中,确定所述SQL指令是否已在Map端进行局部规约,其中,局部规约利用数据的重复性减少Map端与Reduce端之间的数据量;若确定进行局部规约,则对经对经局部规约处理后的数据利用第一排序算法进行排序;若确定不进行局部规约,则对经Mapper输出的数据利用第二排序算法进行排序。所述方法能够根据实际指令匹配合适的数据排序算法,提高了数据排序的效率并且避免了单一排序算法所导致的缺点。 | ||
搜索关键词: | 基于 mapreduce 模型 数据处理 方法 设备 | ||
【主权项】:
1.基于MapReduce模型的数据处理方法,其特征在于,包括:在利用MapReduce模型实现SQL指令的处理中,确定所述SQL指令是否已在Map端进行局部规约,其中,局部规约利用数据的重复性减少Map端与Reduce端之间的数据量;若确定进行局部规约,则利用第一排序算法对经局部规约处理后的数据进行排序;若确定不进行局部规约,则利用与第一排序算法不同的第二排序算法对经Mapper输出的数据进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710072197.3/,转载请声明来源钻瓜专利网。
- 上一篇:基于企业云盘的数据文档按需同步方法
- 下一篇:基于不确定邻居的人群定向方法