[发明专利]一种Web服务器的恶意爬虫防御策略选择方法有效
申请号: | 201710601523.5 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107517200B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 曾剑平;张晓惠 | 申请(专利权)人: | 复旦大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08;H04L12/26 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于网络信息安全技术领域,具体为一种Web服务器的恶意爬虫防御策略选择方法。本发明的逻辑架构包括Web服务器和爬虫,本发明方法的步骤为:计算Web服务器和爬虫的收益与代价;基于不完全信息动态博弈,计算博弈模型的均衡解,即计算Web服务器采取防御策略的期望收益和采取不防御策略时的期望收益,当这两个收益相等时即得到服务器选择防御或不防御策略的临界点;基于不完全信息重复博弈,计算博弈模型的均衡解,即计算某时刻之前爬虫采取正常访问行为,而之后分别选择恶意访问行为和正常访问行为时所获得的收益;当后者大于前者时,爬虫不会采取恶意访问行为的策略;满足这个条件的博弈参数是服务器策略的最佳选择。 | ||
搜索关键词: | 一种 web 服务器 恶意 爬虫 防御 策略 选择 方法 | ||
【主权项】:
一种Web服务器的恶意爬虫防御策略选择方法,其特征在于,逻辑架构包括Web服务器和爬虫,在这样的逻辑架构下,爬虫有两种爬行方式,即正常爬行和恶意爬行;当爬虫采取正常爬行方式时,即对应于用户的正常访问方式和爬虫程序的正常访问方式,反之当采取恶意爬行时,即代表爬虫程序或用户的恶意访问;在这逻辑架构下,恶意爬虫防御策略选择方法的具体步骤为:(1)计算Web服务器和爬虫的收益与代价对于Web服务器而言,其付出的代价在于部署各种软硬件设施用于辨别正常访问行为和恶意访问行为,以及对恶意行为实施阻断;而其收益在于广告推送、信息反馈等;对于爬虫而言,其代价在于恶意访问所需要的投入,其收益在于在预期的时间内获得所需要的页面内容;(2)基于不完全信息动态博弈,计算博弈模型的均衡解根据步骤(1)的收益与代价,计算Web服务器采取防御策略的期望收益和采取不防御策略时的期望收益,当这两个收益相等时即可得到服务器选择防御或不防御策略的临界点;(3)基于不完全信息重复博弈,计算博弈模型的均衡解从爬虫方的角度,计算当某时刻之前爬虫采取正常访问行为,而之后分别选择恶意访问行为和正常访问行为时所获得的收益;当后者大于前者时,爬虫不会采取恶意访问行为的策略;因此,满足这个条件的博弈参数是服务器策略的最佳选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710601523.5/,转载请声明来源钻瓜专利网。