[发明专利]一种基于栈的暗链检测方法在审
申请号: | 201610280325.9 | 申请日: | 2016-04-28 |
公开(公告)号: | CN105975523A | 公开(公告)日: | 2016-09-28 |
发明(设计)人: | 董超;蒋希敏;鲁友炳 | 申请(专利权)人: | 浙江乾冠信息安全研究院有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杜军 |
地址: | 310015 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于栈的暗链检测方法。本发明包括以下步骤:步骤1、预先对暗链进行定义;步骤2、向待检测的Web网站服务器发送HTTP请求,然后利用多线程网络爬虫技术抓取待检测的Web网页,待检测的Web网页返回页面数据;步骤3、利用无界面浏览器渲染页面数据,获得渲染后的Web网页,具体通过执行页面上JS和CSS的代码完成渲染;步骤4、基于栈对页面上的超链接进行检测;步骤5、通过直接查看暗链关键词特征库,获取页面暗链数据。本发明通过栈数据结构和无头浏览器页面渲染的方式,快速准确检测并定位出可能暗链的位置,且更加简单明了。本发明能够检测出黑客入侵网站之后或者web应用开发厂商植入的暗链。 | ||
搜索关键词: | 一种 基于 检测 方法 | ||
【主权项】:
一种基于栈的暗链检测方法,其特征在于包括如下步骤:步骤1、预先对暗链进行定义,同时满足以下条件的为暗链:(1)隐藏的文字和链接让网页使用者不可见;(2)隐藏的文字和链接被认为是一种欺骗搜索引擎的垃圾技术;所述的隐藏的文字和链接是直接植入的形式隐藏,或者动态混淆生成的形式隐藏;步骤2、向待检测的Web网站服务器发送HTTP请求,然后利用多线程网络爬虫技术抓取待检测的Web网页,待检测的Web网页返回页面数据;步骤3、利用无界面浏览器渲染页面数据,获得渲染后的Web网页,具体通过执行页面上JS和CSS的代码完成渲染;步骤4、对页面上的超链接进行检测,解析步骤3渲染后的Web网页,具体如下:4‑1、定义隐藏元素栈H、标签元素栈T和暗链关键词特征库;4‑2、在对渲染后Web网页的解析过程中:若遇到开始标签则调用开始标签处理回调函数,并将开始标签存入标签元素栈T,同时根据步骤1判断该开始标签是否为隐藏元素,若是,则隐藏元素栈H的入栈值为1,否则隐藏元素栈H的入栈值为0;该入栈值所在位置与标签元素栈T中开始标签位置对应;若遇到超链接标签,先将超链接标签存入标签元素栈T,同时根据步骤1判断该超链接标签是否为隐藏元素,若是,则隐藏元素栈H的入栈值为1,同时对该超链接标签的内容进行特征关键词和暗链URL提取,并将提取出的特征关键词和暗链URL存储至暗链关键词特征库;否则判断隐藏元素栈H中前几个入栈值的总和是否大于0,若总和大于0,则判断该超链接标签为隐藏元素,该超链接标签在隐藏元素栈H的入栈值为1,同时对该超链接标签的内容进行特征关键词和暗链URL提取,并将提取出的特征关键词和暗链URL存储至暗链关键词特征库;否则该超链接标签在隐藏元素栈H的入栈值为0;该入栈值所在位置与标签元素栈T中开始标签位置对应;若遇到结束标签则调用结束标签处理回调函数,并将与该结束标签对应的开始标签从标签元素栈T中作出栈处理;同时将与该出栈的开始标签对应的隐藏元素栈H中的值作出栈处理;步骤5、通过直接查看暗链关键词特征库,获取页面暗链数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江乾冠信息安全研究院有限公司,未经浙江乾冠信息安全研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610280325.9/,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示模组及显示装置
- 下一篇:眼镜之镜片防起雾结构