[发明专利]一种窃取网站数据的检测方法、装置、设备及存储介质在审

专利信息
申请号: 201911311283.0 申请日: 2019-12-18
公开(公告)号: CN112989327A 公开(公告)日: 2021-06-18
发明(设计)人: 余江;章锁柱 申请(专利权)人: 拓尔思天行网安信息技术有限责任公司
主分类号: G06F21/55 分类号: G06F21/55;G06F21/56;G06F16/2458
代理公司: 北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人: 郭栋梁
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 窃取 网站 数据 检测 方法 装置 设备 存储 介质
【说明书】:

本申请公开了一种窃取网站数据的检测方法、装置、设备及存储介质,根据预设时间提取网站访问的镜相流量,生成镜相流量报文;统计镜相流量报文中每个链接的第一受访次数,对第一受访次数进行排名,得到每个链接的第一排名位次;比较每个链接的第一排名位次与受访行为数据模型中相同预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。本申请实施例以网站中每个链接的受访次数排名为监测对象,并通过流量分析技术与统计学习技术相结合的方式,不断自学习以更新受访行为数据模型,从而将网站的实际受访情况与该受访行为数据模型进行对比分析,能够快速、准确地对窃取网站数据的行为进行检测,确保网络运行的安全。

技术领域

发明一般涉及信息安全技术领域,具体涉及一种窃取网站数据的检测方法、装置、设备及存储介质。

背景技术

随着科学技术的蓬勃发展,网站作为主流的信息展示媒介,给我们的日常生活带来了极大地便利。在各类网络中,每个网站都有公开的页面供用户浏览和使用,但是有一些恶意的爬虫软件却通过反复访问公开页面数据,不断地扒取网站的内部数据,威胁到网络安全,甚至还会造成用户信息的泄露。比如,网络中机动车信息页面仅供交通管理部门的工作人员正常查询使用,而爬虫软件却非法恶意地扒取机动车信息并售卖。

由于网络爬虫(又被称为网页蜘蛛、网页追逐者)是一种按照一定规则,自动地抓取网站信息的程序或者脚本。因此,现有窃取网站数据的检测方法包括通过http协议头域的Uer-Agent来识别爬虫软件、通过robots.txt来限制爬虫软件、或者通过JS脚本来防止爬虫软件的操作,比如获取验证码和滑动解锁等。

在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:方法一要求在爬虫软件发起http请求的头域中标识爬虫的名称,但恶意爬虫软件会通过低频次的慢速数据扒取,模拟标准浏览器的Uer-Agent字段,以绕过Uer-Agent字段检查机制;方法二要求爬虫软件遵守robots.txt里的协议,但遵守与否,取决于爬虫软件的编写者;方法三中爬虫软件通过PhantomJS可以在没有低频次的慢速数据扒取图形界面的情况下,完全模拟一个浏览器,从而避开检测。

发明内容

鉴于现有技术中的上述缺陷或不足,期望提供一种窃取网站数据的检测方法、装置、设备及存储介质,能够快速、准确地对窃取网站数据的行为进行检测,确保网络运行的安全。

第一方面,本申请提供一种窃取网站数据的检测方法,所述方法包括:

根据预设时间提取网站访问的镜相流量,生成镜相流量报文;

统计所述镜相流量报文中每个链接的第一受访次数,对所述第一受访次数进行排名,得到所述每个链接的第一排名位次;

比较所述每个链接的第一排名位次与受访行为数据模型中相同所述预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。

第二方面,本申请提供一种窃取网站数据的检测装置,所述装置包括:

提取模块,配置用于根据预设时间提取网站访问的镜相流量,生成镜相流量报文;

排名模块,配置用于统计所述镜相流量报文中每个链接的第一受访次数,对所述第一受访次数进行排名,得到所述每个链接的第一排名位次;

比较模块,配置用于比较所述每个链接的第一排名位次与受访行为数据模型中相同所述预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。

第三方面,本申请提供一种电子设备,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如第一方面所述的窃取网站数据的检测方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拓尔思天行网安信息技术有限责任公司,未经拓尔思天行网安信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911311283.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top