[发明专利]一种数据聚合方法、装置、存储介质及电子设备在审
申请号: | 201910533378.0 | 申请日: | 2019-06-19 |
公开(公告)号: | CN112115163A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 韦永剑;周涛;王昭博 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/22;G06F16/23;G06F16/27;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 聚合 方法 装置 存储 介质 电子设备 | ||
本发明实施例提供一种数据聚合方法、装置、存储介质及电子设备,该方法包括:通过上游流处理平台接收变更消息,所述变更数据包括目标标识以及变更数据;从分布式存储系统中读取以所述目标标识为主键的主表数据,基于所述变更数据对所述主表数据进行聚合,生成聚合数据;将所述聚合数据发送到下游流处理平台。利用Flink分布式流式处理和分布式存储系统海量存储能力,能够在保证消息时序的情况下,实现实时高吞吐的数据聚合。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种数据聚合方法、装置、存储介质及电子设备。
背景技术
随着互联网的发展,搜索引擎是用户快速获取信息的主要手段。
在电商搜索领域,搜索底层的原始数据大部分存储各种各样mysql表中,构建索引之前,需要将各个表的数据聚合成完整的记录。在电商领域搜索数据具有海量且变化频繁的特点,从而会产生海量的实时消息,如何将海量实时数据做到低延迟,高吞吐的聚合是一个非常大的挑战。比如在电商大促期间,商品信息变更频繁,面对海量实时数据,如果聚合延迟,消息积压,则无法保证消息的实时性,带来不好的用户体验,例如,价格消息积压,商家促销的价格调整就无法实时生效,库存变更延迟,用户可能看到搜索出来商品无货,其实是有货的情况。
因此需要一种新的数据聚合方法、装置、存储介质及电子设备,实现百万级别的海量数据的低延迟高吞吐的数据聚合。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种数据聚合方法、装置、存储介质及电子设备,实现百万级别的海量数据的低延迟高吞吐的数据聚合。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的第一方面,提供一种数据聚合方法,其中,所述方法包括:通过上游流处理平台接收变更消息,所述变更数据包括目标标识以及变更数据;从分布式存储系统中读取以所述目标标识为主键的主表数据,基于所述变更数据对所述主表数据进行聚合,生成聚合数据;将所述聚合数据发送到下游流处理平台。
在本发明的一些示例性实施例中,基于前述方案,所述聚合数据包括:主表聚合数据;
所述基于所述变更数据对所述主表数据进行聚合,生成聚合数据,包括:判断所述分布式存储系统的主表中与所述变更数据中的变更字段对应的列是否为空;若所述主表中与所述变更数据中的变更字段对应的列为空,将所述变更字段写入所述列,并基于写入所述变更字段的主表生成主表聚合数据。
在本发明的一些示例性实施例中,基于前述方案,所述方法还包括:若所述主表中与所述变更数据中的变更字段对应的列不为空,比较所述变更字段的版本号与所述列的版本号的大小;若所述变更字段的版本号不大于所述列的版本号,基于所述主表生成主表聚合数据;若所述变更字段的版本号大于所述列的版本号,将所述列的数据替换为所述变更字段,并基于替换后的主表数据生成主表聚合数据。
在本发明的一些示例性实施例中,基于前述方案,所述聚合数据还包括:复合聚合数据;
所述方法还包括:从所述分布式存储系统的附表中读取以所述主表聚合数据中的指定列为主键的附表数据;判断所述附表数据是否为空;若所述附表数据为空,基于所述主表聚合数据生成复合聚合数据。
在本发明的一些示例性实施例中,基于前述方案,所述方法还包括:若所述附表数据不为空,基于所述主表聚合数据以及所述附表生成复合聚合数据。
在本发明的一些示例性实施例中,基于前述方案,所述目标标识包括商品标识。
在本发明的一些示例性实施例中,基于前述方案,所述方法由基于Flink的数据聚合装置执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910533378.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置