[发明专利]去重计数方法及设备有效
申请号: | 201510069931.1 | 申请日: | 2015-02-10 |
公开(公告)号: | CN105989072B | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 胡四海 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种去重计数方法及设备,本申请根据各个数据的上一次出现的时间段的记录和当前时间段内的各个数据可以快速获取该时间段内出现的数据个数及该时间段分别相对于前时间段出现的数据个数的增量,便于后续基于数据个数和/或数据个数的增量快速进行各种数据统计。另外,本申请利用数据个数和数据个数的增量,能够对若干相邻的时间段内的组合的数据进行精确去重计数。此外,本申请以流式的方式快速和精确地获取和记录某个时间段内出现的数据个数及该时间段分别相对于前时间段出现的数据个数的增量,只需记录和更新各个数据的上一次出现的时间段,无需记录每个时间段中数据出现的历史明细,减少数据存储量。 | ||
搜索关键词: | 计数 方法 设备 | ||
【主权项】:
1.一种去重计数方法,其中,包括:依次根据各个数据的上一次出现的时间段M的记录和当前第K个时间段内的各个数据确定第K个时间段内出现的数据个数,及第K个时间段分别相对于前1个至前K‑1个时间段出现的数据个数的增量,其中,N,K,M为正整数,N≥2,K={1,2,...,N},1≤M≤N,M≤K;其中,确定第K个时间段内出现的数据个数及第K个时间段分别相对于前1个至前K‑1个时间段出现的数据个数的增量,包括:记当前第K个时间段内的数据个数、第K个时间段分别相对于前1个至前K‑1个时间段的数据个数的增量分别初始为0;判断第K个时间段内的每个数据是否已有所述记录,若无记录,分别对第K个时间段内出现的数据个数、第K个时间段分别相对于前1至前K‑1个时间段出现的数据个数的增量加1后,增加该数据的上一次出现的时间段的记录;若有记录,判断时间段M的值,若M=K‑1,根据该数据的上一次出现的时间段M的记录,对第K个时间段内出现的数据个数加1后,更新该数据的上一次出现的时间段M的记录;若M≤K‑2,根据该数据的上一次出现的时间段M的记录,对第K个时间段内出现的数据个数、第K个时间段分别相对于前1个至前N‑M‑1个时间段的数据个数的增量加1后,更新该数据的上一次出现的时间段M的记录。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510069931.1/,转载请声明来源钻瓜专利网。