[发明专利]应用上、下线数据统计方法及装置有效
申请号: | 201710010785.4 | 申请日: | 2017-01-06 |
公开(公告)号: | CN108280094B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 王洪岭;康明吉;秦娇;路博;王跃;乔亲旺;于慧文 | 申请(专利权)人: | 广州泰尔智信科技有限公司 |
主分类号: | G06F16/954 | 分类号: | G06F16/954;G06F16/953 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 任媛 |
地址: | 510060 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用上 下线 数据 统计 方法 装置 | ||
本发明属于应用数据统计技术领域,具体涉及一种应用上、下线数据统计方法及装置,可实现判断应用是否在线及应用上、下线的情况。本发明提供的应用上、下线数据统计方法,包括:利用爬虫技术对已有地址数据表中的应用地址进行访问;获取服务器返回的查询状态,根据所述查询状态统计当前时间段内在线的应用和已下线的应用,删除所述地址数据表中已下线的应用。本发明提供的应用上、下线数据统计方法及装置,利用爬虫技术重复爬取地址数据表中的应用地址,统计应用商店中一段时间内(例如某天、某周、某月)应用的在线、上线、下线情况。
技术领域
本发明涉及应用数据统计技术领域,具体涉及一种应用上、下线数据统计方法及装置。
背景技术
移动应用程序监测,主要是通过爬虫技术爬取应用商店的具体信息、应用详细信息、每个应用的下载量等等,对应用市场中的应用进行统计,为产业支撑、决策提供可靠的信息。由于各个应用的更新换代很频繁,每天都有新的应用上线,也有大量的应用下线,应用的版本也会不断更新,而现有的应用统计方法都是累计统计的数据,因此,无法对已经下线的应用或更新版本的应用进行统计,无法获知当前在线的应用还有多少,更无法获知在某段时间内上线/下线的应用有多少。
发明内容
针对现有技术中的缺陷,本发明提供的应用上、下线数据统计方法及装置,利用爬虫技术重复爬取地址数据表中的应用地址,统计应用商店中一段时间内应用的在线、上线、下线情况。
第一方面,本发明提供的一种应用上、下线数据统计方法,包括:利用爬虫技术对已有地址数据表中的应用地址进行访问;获取服务器返回的查询状态,根据所述查询状态统计当前时间段内在线的应用和已下线的应用,删除所述地址数据表中已下线的应用。
优选地,所述根据所述查询状态统计当前时间段内在线的应用和已下线的应用,包括:若查询状态为访问失败,则将访问失败的应用地址放入新建的错误数据表中;若查询状态为跳转,则将跳转后的网页地址放入新建的错误数据表中;遍历完所述地址数据表后,遍历新建的错误数据表,在遍历错误数据表的过程中,针对查询状态为访问失败或跳转的情况,则继续建立新的错误数据表存储访问失败或跳转的应用地址,直到达到预设条件,若还有访问失败的应用地址,则认为应用已下线,将已下线的应用地址移入下线数据表中。
优选地,所述预设条件为遍历次数达到次数阈值或遍历时间达到时间阈值。
优选地,还包括:若所述查询状态为跳转,且通过跳转后的网页地址能够爬取到应用的信息,则将跳转的目标地址添加到所述地址数据表中。
优选地,还包括:若所述查询状态为成功,则解析所述服务器返回的报文,根据报文内容判断应用的版本是否更新,统计当前时间段内应用的版本更新情况。
第二方面,本发明提供的一种应用上、下线数据统计装置,包括:数据爬取模块,用于利用爬虫技术对已有地址数据表中的应用地址进行访问;应用统计模块,用于获取服务器返回的查询状态,根据所述查询状态统计当前时间段内在线的应用和已下线的应用,删除所述地址数据表中已下线的应用。
优选地,所述应用统计模块具体用于:若查询状态为访问失败,则将访问失败的应用地址放入新建的错误数据表中;若查询状态为跳转,则将跳转后的网页地址放入新建的错误数据表中;遍历完所述地址数据表后,遍历新建的错误数据表,在遍历错误数据表的过程中,针对查询状态为访问失败或跳转的情况,则继续建立新的错误数据表存储访问失败或跳转的应用地址,直到达到预设条件,若还有访问失败的应用地址,则认为应用已下线,将已下线的应用地址移入下线数据表中。
优选地,所述预设条件为遍历次数达到次数阈值或遍历时间达到时间阈值。
优选地,所述应用统计模块还用于:若所述查询状态为跳转,且通过跳转后的网页地址能够爬取到应用的信息,则将跳转的目标地址添加到所述地址数据表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州泰尔智信科技有限公司,未经广州泰尔智信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710010785.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:应用信息获取方法及装置
- 下一篇:智能虚拟客服系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置