[发明专利]一种根据请求数据防爬虫系统和方法在审

专利信息
申请号: 201911229450.7 申请日: 2019-12-04
公开(公告)号: CN111241541A 公开(公告)日: 2020-06-05
发明(设计)人: 郑磊 申请(专利权)人: 珠海横琴电享科技有限公司
主分类号: G06F21/56 分类号: G06F21/56;G06F16/951;G06F21/60
代理公司: 广州恒华智信知识产权代理事务所(普通合伙) 44299 代理人: 唐一鸣
地址: 519000 广东省珠海市横琴新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 根据 请求 数据 爬虫 系统 方法
【说明书】:

发明公开了一种根据请求数据防爬虫系统和方法,系统包括cookie加密生成模块、cookie存储模块和比对分析模块,所述cookie加密生成模块用于根据用户User‑Agent、当前时间戳、当前IP地址加密生成cookie;所述cookie存储模块用于存储cookie黑名单数据;所述比对分析模块用于比对分析当前访问cookie与cookie黑名单数据,以针对当前访问cookie执行反应操作。本发明可以有效防止恶意爬虫使用代理IP快速的大量获取数据,保护公司的原创数据利益,防止恶意爬虫大量获取到企业原创数据后发布在其他同类产品上;本发明可以在用户不登陆的情况下识别爬虫,不用客户登陆,保留客户浏览的意向,同时也可以实现防爬虫效果。

技术领域

本发明涉及数据处理技术领域,特别是一种根据请求数据防爬虫系统和方法。

背景技术

现在互联网产品中的原创数据容易被其他公司或个人利用恶意爬虫获取到,会对原产品的利益产生损害,本技术用来解决大部分爬虫利用代理IP频繁访问获取数据的问题。与本发明相关的现有最接近技术是根据用户IP访问频率来识别恶意爬虫,如果同一IP一段时间内访问次数过多,就将IP加入黑名单。缺点在于恶意爬虫可以使用代理,每次请求使用不同的IP来绕过IP速度监测。

发明内容

本发明上述问题,提供一种根据请求数据防爬虫系统。本发明的技术方案为:

一种根据请求数据防爬虫系统,包括cookie加密生成模块、cookie存储模块和比对分析模块,所述cookie加密生成模块用于根据用户User-Agent、当前时间戳、当前IP地址加密生成cookie;所述cookie存储模块用于存储cookie黑名单数据;所述比对分析模块用于比对分析当前访问cookie与cookie黑名单数据,以针对当前访问cookie执行反应操作。

本发明的另一方面,以上述系统进行根据请求数据防爬虫方法,包括如下步骤:

100、用户首次请求访问,所述cookie加密生成模块生成加密cookie并允许用户访问目标页面;

101、用户再次请求访问时,判断用户携带的cookie是否有效,cookie有效则执行步骤102,cookie无效则重新生成加密cookie再执行步骤102;

102、所述比对分析模块比对用户携带的cookie与所述cookie存储模块存储的cookie黑名单数据,当该用户携带的cookie属于所述cookie黑名单数据时拦截用户的访问请求,当该用户携带的cookie不属于所述cookie黑名单数据时执行步骤103;

103、所述比对分析模块判断该用户携带的cookie访问速度,超过速度限制则将该用户携带的cookie存储到所述cookie存储模块中更新cookie黑名单数据数据并拦截用户的访问请求,没有超过速度限制则执行步骤104;

104、所述比对分析模块判断当前请求用户的ip是否与加密cookie中的ip匹配,如果两者ip不匹配则将该加密cookie存储到所述cookie存储模块中更新cookie黑名单数据数据并拦截用户的访问请求,如果两者ip匹配则允许用户访问目标页面。

作为本发明进一步地说明,所述步骤100中的加密cookie由所述cookie加密生成模块根据用户User-Agent、当前时间戳和当前IP地址等关键访问参数加密生成。

作为本发明进一步地说明,所述步骤103和步骤104中速度限制判断和ip匹配判断的顺序可以互换。

作为本发明进一步地说明,包括一上级页面,所述cookie在用户访问所述上级页面时生成。

本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被计算机或处理器执行以实现上述根据请求数据防爬虫方法。

本发明的有益效果:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海横琴电享科技有限公司,未经珠海横琴电享科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911229450.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top