[发明专利]一种动态防爬虫的方式在审

专利信息
申请号: 201711298334.1 申请日: 2017-12-08
公开(公告)号: CN108133140A 公开(公告)日: 2018-06-08
发明(设计)人: 张琳艳 申请(专利权)人: 成都数聚城堡科技有限公司
主分类号: G06F21/56 分类号: G06F21/56;G06F17/30
代理公司: 成都金英专利代理事务所(普通合伙) 51218 代理人: 袁英
地址: 610041 四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种动态防爬虫的方式,所述方式包括:运用机器学习方法采集所有用户的访问信息,确定正常用户特征数值,形成正常用户模型;对不符合正常用户模型的访问定义为非正常的访问,将非正常访问请求通过归集算法,将其为爬虫的概率归集到一定的区间;将达到该区间上限的访问通过二次鉴权方式,验证此访问是否为爬虫。如果多次被要求二次鉴权,那么就会暂停他的访问,同时更新防爬虫的限制规则。本发明能够动态更新爬虫的判定规则,完善了防护爬虫的安全策略,提高了网络信息的安全性,也提升了网络防护的智能水平。
搜索关键词: 爬虫 正常用户 访问 非正常访问 安全策略 动态更新 访问信息 机器学习 鉴权方式 判定规则 区间上限 网络防护 网络信息 限制规则 智能水平 鉴权 算法 采集 防护 验证 概率 更新
【主权项】:
一种动态防爬虫的方式,其特征在于,所述方式包括:S1:运用机器学习方法采集所有用户的访问信息,确定正常用户特征数值,形成正常用户模型;S2:将每条访问与S1生成的正常用户模型进行对比,若对比结果为非正常的访问,转到S3;若对比结果为正常的访问,转到S6;S3:将非正常访问请求通过归集算法,将其为爬虫用户请求的概率归集到一定的区间;未达到该区间上限则转到S6,将达到该区间上限的访问转到S4;S4:判断该访问用户的二次鉴权次数是否达到上限,到达上限转到S7,未达上限转到S5;S5:通过二次鉴权方式验证此访问用户是否为爬虫,验证未通过则转到S7,通过则转到S6;S6:允许继续访问,并更新正常用户模型,并转到S8;S7:暂停他的访问,并更新爬虫用户模型;S8:结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数聚城堡科技有限公司,未经成都数聚城堡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711298334.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top