[发明专利]数据检测方法及系统、服务器在审
申请号: | 201710888265.3 | 申请日: | 2017-09-27 |
公开(公告)号: | CN109560979A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 程峰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面数据 检测 数据检测 访问数据 申请 服务器 访问 | ||
本申请提供了一种数据检测方法及系统,其中一种方法包括:从URL地址的访问数据中确定URL地址,确定与URL地址对应的页面数据,对与URL地址对应的页面数据进行检测。由于本申请仅对被用户真实访问的URL地址对应的页面数据进行检测,不对无需检测URL地址对应的页面数据进行检测,所以可以提高页面数据的检测效率。
技术领域
本申请涉及通信技术领域,尤其涉及一种数据检测方法及系统。
背景技术
为了检测网站的异常数据,网站对应的服务器(后续称为用户服务器)通常会将网站首页的URL地址发送至提供检测服务的服务器(后续称为检测服务器)。检测服务器将网站首页的URL地址添加至待检测列表中。
对于一个URL地址而言,检测服务器会从用户服务器获取与URL地址对应的页面数据,并检测页面数据是否出现异常;在页面数据存在链接的情况下,采用爬虫方式获取页面数据的链接,将链接的URL地址添加至待检测列表中。检测服务器会按上述方式,逐个对待检测列表中URL地址对应的页面数据进行检测。
由于网站中各个URL地址的访问情况不尽相同,有的URL地址被大量访问,有的URL地址无人访问。对无人访问的URL地址对应的页面数据进行检测的意义不大,所以待检测列表包括一部分无需检测URL地址。
现有方案中检测服务器基于待检测列表进行检测的过程中,会对一部分检测意义不大的URL地址进行检测,这会降低页面数据的检测效率。
发明内容
鉴于此,本申请提供一种数据检测方法及系统,可以提高页面数据的检测效率。
为了实现上述目的,本申请提供了以下技术手段:
一种数据检测系统,包括:
用户服务器,用于在网站运行过程中记录URL地址的访问数据,发送URL地址的访问数据至检测服务器;接收所述检测服务器发送的包含URL地址的页面数据获取指令,查找与URL地址对应的页面数据,发送与URL地址对应的页面数据至检测服务器;
检测服务器,用于接收所述用户服务器发送的URL地址的访问数据;从URL地址的访问数据中确定URL地址,向所述用户服务器发送包含URL地址的页面数据获取指令,接收所述用户服务器发送的与URL地址对应的页面数据,对与URL地址对应的页面数据进行检测。
一种数据检测方法,包括:
从URL地址的访问数据中确定URL地址;
确定与URL地址对应的页面数据;
对与URL地址对应的页面数据进行检测。
可选的,所述从URL地址的访问数据中确定URL地址,包括:
获取检测周期内的多个访问信息集合;其中,所述访问信息集合包括多条URL地址的访问记录;
分析所述多个访问信息集合,确定所述多个访问信息集合中出现的URL地址。
可选的,所述从URL地址的访问数据中确定URL地址,包括:
获取检测周期内的多个访问信息集合;其中,所述访问信息集合包括多条URL地址的访问记录;
分析所述多个访问信息集合,确定所述多个访问信息集合出现的URL地址和URL地址的访问频次;
按访问频次由高至低的顺序,筛选出多个URL地址。
可选的,所述从URL地址的访问数据中确定URL地址,包括:
获取检测周期内的多个访问信息集合;其中,所述访问信息集合包括多条URL地址的访问记录;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710888265.3/2.html,转载请声明来源钻瓜专利网。