[发明专利]一种数据指标统计方法及装置在审
申请号: | 201710725090.4 | 申请日: | 2017-08-22 |
公开(公告)号: | CN107633347A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 马文琪;程磊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 指标 统计 方法 装置 | ||
技术领域
本申请涉及数据处理技术领域,特别涉及一种数据指标统计处理方法及装置。
背景技术
近几年,随着大数据处理技术的快速发展,在很多业务场景下需要对大量用户数据进行实时分析处理。在实时数据分析过程中,通常需要对某些数据指标进行实时统计。典型的业务场景如网络购物平台,在某些重要的购物促销活动日,通常需要对平台中的某些数据指标进行统计。从大方向来说,所述数据指标可以包括交易量、交易金额、广告页面访问次数;从小方向来说,其中,交易量指标又可以包括平台整体交易量、各个城市交易量、行业交易量、商户交易量、门店交易量等多个维度的交易量。
为了满足大数据的实时处理需求,现有技术中出现多个如Storm、Spark、Samza等流式大数据处理框架以及基于上述框架所构建的流式大数据处理引擎,典型的如阿里巴巴的Galaxy计算引擎等。在利用上述流式大数据处理引擎进行数据指标计算时,可以划分多个计算模块分别统计所述数据指标,其中所述计算模块与所述数据指标具有一一对应的关系,即一个计算模块统计一个数据指标。在实际的业务场景中,需要统计的数据指标往往在不断地扩展,例如,已经统计了北京的交易量,发现还需要统计上海的交易量。针对上述情况,利用现有技术中的流式大数据处理引擎进行数据指标统计时,每增加一个数据指标就需要增加一个新的计算模块进行处理。但是,在大数据处理引擎中每增加一个计算模块,所述引擎的整体性能可能降低很多。并且,在流式大数据处理引擎中增加一个新的计算模块,需要编写代码后重新发布上线,开发周期长,任务稳定性较低。
因此,现有技术中亟需一种能够在大数据处理引擎中快速、灵活地新增数据统计指标的方式。
发明内容
本申请实施例的目的在于提供一种数据指标统计方法及装置,不仅可以节省计算引擎的利用资源,还可以提高在计算引擎中增加新数据指标的灵活性,降低在计算引擎中增加新数据指标的复杂度。
本申请实施例提供的一种数据指标统计方法及装置具体是这样实现的:
一种数据指标统计方法,所述方法包括:
获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;
根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。
一种数据指标统计装置,所述装置包括:
数据获取单元,用于获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;
数据分配单元,用于根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。
一种数据处理装置,所述装置包括:
至少一个计算模块,所述计算模块用于对具有相同数据计算类型的多个数据指标进行统计计算。
一种数据指标统计装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:
获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;
根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。
本申请提供的数据指标统计方法及装置,可以将具有相同计算类型的多个数据指标分配至同一个计算模块中进行统计计算。这样,对于计算引擎来说,在针对海量数据实时统计计算的过程中,当需要增加新的数据指标时,可以在不需要增加新的计算模块的情况下,将统计新的数据指标所使用的用户数据划分至对应的计算模块中。利用同一个计算模块实时统计多个具有相同计算类型的数据指标,不仅可以节省计算引擎的利用资源,还可以提高在计算引擎中增加新数据指标的灵活性,降低在计算引擎中增加新数据指标的复杂度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的数据指标统计方法的一种实施例的方法流程图;
图2是本申请提供的确定计算类型方法的一种实施例的方法流程图;
图3是本申请提供的分配用户数据方法的一种实施例的方法流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710725090.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置