[发明专利]数据统计方法及装置有效
申请号: | 201310286989.2 | 申请日: | 2013-07-09 |
公开(公告)号: | CN103312568A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 洪超;杨基彬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 统计 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据统计方法及装置。
背景技术
网站分析在统计流量时,需要统计流量访问的客户端时间,而访问的客户可能会是在24个时区都存在,现有处理方案为每天凌晨对数据进行处理(+8区时间),所有处理的数据接收数据时间均为昨天一天的接收数据,但在对数据的客户端时间进行分析时,会加上各自会话的时区,就有可能导致会有前天的数据出现,这样就导致按天处理时,客户在查看昨天的会话数据时,发现每过一天会多一部分,而产生了所谓的数据波动问题。
这种基于服务端的接收时间进行按天处理的方式,会导致每天数据处理后,按照客户端时间进行查询,昨天的数据在处理后会新增一部分会话的相关指标,从而导致用户只能获取前天的准确会话数,而不能准确的知道昨天的会话数。
例如,假设有一用户在本地时间2013-04-17 23:00:00(2时区),发生了某一会话,对应于正8区的服务器接收时间为2013-04-18 7:00:00,在对17号数据进行处理时,即18号凌晨,该部分数据还发生,该部分数据只能在19号凌晨进行处理,这样在19号处理完后,分析17号的数据,会发现比18号的数据分析多了此条会话,多了此条会话,会导致数据波动问题,即19号的处理的数据里,部分数据是17号的,从而导致17号的数据在19号查看时比18号会多一些。如果用户出会话数报表的话,则会发现报表数据在17号的数据在19号处理后变多了,即系统数据不一致。引发数据波动的几种示例情况:
1,未超时会话跨越零点边界:假设所有访客、客户网站主时区和系统时区都是+8区,系统在+8区的每天凌晨1点处理一次。如图1所示,系统第一次处理的时候,由于此会话未超时,所以不进入系统,客户第一次看4.15号没有数据。系统第2次处理的时候,此会话已经超时,所以进入系统,客户看4.15号数据就有了,数据有了波动。
2,小众时区的影响:如图2所示,模拟了3条访问数据的情况,如图2所示,客户两次看系统看到的4.15号的数据是不同的,这是因为少量其他时区的数据在下一个处理周期的时候才被处理了。
3,系统时区和客户主时区不同:假设客户网站主时区是在+11区和系统时区都是+8区,系统在+8区依然每天凌晨1点处理一次。图3示出了总共2条访问数据的情况。如图3所示,客户在本地2点访问的时候,系统还没有开始处理,因此4.15号没有数据,然后客户在本地5点访问时,又看到4.15号有1个访问数据,数据出现波动。
针对现有技术中对服务器的接收时间按天进行会话统计会产生数据波动的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术对服务器的接收时间按天进行会话统计会产生数据波动的问题,目前尚未提出有效的解决方案,为此,本发明的主要目的在于提供一种数据统计方法及装置,以解决上述问题。
为了实现上述目的,根据本发明的一个方面,提供了一种数据统计方法,该方法包括:获取第一会话信息集中的第一波动数据,其中,第一波动数据为会产生数据波动的数据;对第一波动数据进行访问时间调整获取第一会话数据;使用第一会话数据对第一会话信息集进行更新得到第二会话信息集;以及对第二会话信息集中的数据进行数据统计。
进一步地,第一会话信息集中包括第一时区会话集,其中,获取第一会话信息集中的第一波动数据的步骤包括:判断第一时区会话集中的第一子会话信息是否是超时数据;在第一子会话信息不是超时数据的情况下,确定第一子会话信息为第一波动数据。
进一步地,对第一波动数据进行访问时间调整获取第一会话数据的步骤包括:为第一波动数据的实体数据和数据ID增加第一标识得到第一会话数据。
进一步地,第一会话信息集中还包括第二时区会话集,其中,获取第一会话信息集中的第一波动数据的步骤包括:比较访问时间与处理时间的大小,其中,访问时间为第二时区会话集中的第二子会话信息产生的时间,处理时间为统计的数据的时间;在访问时间小于处理时间的情况下,确定第二子会话信息为第一波动数据;在访问时间等于处理时间的情况下,判断第二子会话信息是否是超时数据,其中,在第二子会话信息不是超时数据的情况下,确定与访问时间对应的第二子会话信息为第一波动数据。
进一步地,对第一波动数据进行访问时间调整获取第一会话数据的步骤包括:在访问时间小于处理时间的情况下,将第一波动数据的访问时间加1以得到第一会话数据;在访问时间等于处理时间且在第二子会话信息不是超时数据的情况下,将第二子会话信息的实体数据和数据ID增加第二标识以得到第一会话数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310286989.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:线路切换方法及装置
- 下一篇:基于OSEK标准的休眠控制方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置