[发明专利]一种窃取网站数据的检测方法、装置、设备及存储介质在审
申请号: | 201911311283.0 | 申请日: | 2019-12-18 |
公开(公告)号: | CN112989327A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 余江;章锁柱 | 申请(专利权)人: | 拓尔思天行网安信息技术有限责任公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/56;G06F16/2458 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 窃取 网站 数据 检测 方法 装置 设备 存储 介质 | ||
本申请公开了一种窃取网站数据的检测方法、装置、设备及存储介质,根据预设时间提取网站访问的镜相流量,生成镜相流量报文;统计镜相流量报文中每个链接的第一受访次数,对第一受访次数进行排名,得到每个链接的第一排名位次;比较每个链接的第一排名位次与受访行为数据模型中相同预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。本申请实施例以网站中每个链接的受访次数排名为监测对象,并通过流量分析技术与统计学习技术相结合的方式,不断自学习以更新受访行为数据模型,从而将网站的实际受访情况与该受访行为数据模型进行对比分析,能够快速、准确地对窃取网站数据的行为进行检测,确保网络运行的安全。
技术领域
本发明一般涉及信息安全技术领域,具体涉及一种窃取网站数据的检测方法、装置、设备及存储介质。
背景技术
随着科学技术的蓬勃发展,网站作为主流的信息展示媒介,给我们的日常生活带来了极大地便利。在各类网络中,每个网站都有公开的页面供用户浏览和使用,但是有一些恶意的爬虫软件却通过反复访问公开页面数据,不断地扒取网站的内部数据,威胁到网络安全,甚至还会造成用户信息的泄露。比如,网络中机动车信息页面仅供交通管理部门的工作人员正常查询使用,而爬虫软件却非法恶意地扒取机动车信息并售卖。
由于网络爬虫(又被称为网页蜘蛛、网页追逐者)是一种按照一定规则,自动地抓取网站信息的程序或者脚本。因此,现有窃取网站数据的检测方法包括通过http协议头域的Uer-Agent来识别爬虫软件、通过robots.txt来限制爬虫软件、或者通过JS脚本来防止爬虫软件的操作,比如获取验证码和滑动解锁等。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:方法一要求在爬虫软件发起http请求的头域中标识爬虫的名称,但恶意爬虫软件会通过低频次的慢速数据扒取,模拟标准浏览器的Uer-Agent字段,以绕过Uer-Agent字段检查机制;方法二要求爬虫软件遵守robots.txt里的协议,但遵守与否,取决于爬虫软件的编写者;方法三中爬虫软件通过PhantomJS可以在没有低频次的慢速数据扒取图形界面的情况下,完全模拟一个浏览器,从而避开检测。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种窃取网站数据的检测方法、装置、设备及存储介质,能够快速、准确地对窃取网站数据的行为进行检测,确保网络运行的安全。
第一方面,本申请提供一种窃取网站数据的检测方法,所述方法包括:
根据预设时间提取网站访问的镜相流量,生成镜相流量报文;
统计所述镜相流量报文中每个链接的第一受访次数,对所述第一受访次数进行排名,得到所述每个链接的第一排名位次;
比较所述每个链接的第一排名位次与受访行为数据模型中相同所述预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。
第二方面,本申请提供一种窃取网站数据的检测装置,所述装置包括:
提取模块,配置用于根据预设时间提取网站访问的镜相流量,生成镜相流量报文;
排名模块,配置用于统计所述镜相流量报文中每个链接的第一受访次数,对所述第一受访次数进行排名,得到所述每个链接的第一排名位次;
比较模块,配置用于比较所述每个链接的第一排名位次与受访行为数据模型中相同所述预设时间对应的第二排名位次,并当比较结果大于阈值时,发送报警信息。
第三方面,本申请提供一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如第一方面所述的窃取网站数据的检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拓尔思天行网安信息技术有限责任公司,未经拓尔思天行网安信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911311283.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低残油发酵生产鼠李糖脂的方法
- 下一篇:文件整理方法、装置及相关设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置