[发明专利]一种使用引导型搜索的网页木马检测系统及方法在审

专利信息
申请号: 201711291684.5 申请日: 2017-12-08
公开(公告)号: CN108229166A 公开(公告)日: 2018-06-29
发明(设计)人: 徐光侠;郑爽;李伟凤;王天羿;刘榕;马传龙;马创;刘俊 申请(专利权)人: 重庆邮电大学
主分类号: G06F21/56 分类号: G06F21/56;G06F17/30;H04L29/06
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网页 搜索 下载 核心组件 搜索引擎 特征分析 外围程序 网页检测 引导型 检测 网页木马检测 过滤器程序 程序分析 输入网页 网络爬虫 网页分类 网页木马 组件分析 过滤 数据库 互联网 分析
【说明书】:

发明请求保护一种使用引导型搜索的网页木马(挂马网页)检测方法。该方法主要由两个部分构成,分为外围程序部分和核心组件部分。外围程序使用网络爬虫程序从互联网中下载网页,通过一个弱过滤器程序过滤掉明显无害的网页,并将结果输入网页检测程序。网页检测程序将挂马网页分类出来,存入数据库,形成挂马网页黑名单,并将一部分送至核心组件部分分析。核心组件包括数个特征分析组件和搜索引擎工具。特征分析组件分析出输入的挂马网页的特征,并通过使用这些特征引导搜索引擎搜索并下载相似的网页。通过这种引导搜索下载的方式,所获取的网页中,挂马网页的比例会有显著提高。引导搜索下载的网页直接提交至网页检测程序分析,从而在较短的时间内找到大量挂马网页,提高检测的效率。

技术领域

本发明属于信息安全与数据挖掘的交叉领域,属于一种网页木马检测的方法,主要应用域名和网页内容分析网页木马特征,并使用引导搜索引擎搜索下载与挂马网页相似的网页来提高检测效率。

背景技术

互联网已逐渐成为人们搜索信息、开展业务和进行娱乐活动的主要载体。与此同时,互联网也成为一些不法分子用来攻击用户的主要平台。其中网页木马,又称为挂马网页或恶意网页,是最常见的攻击方式。下文中挂马网页和网页木马具有相同的含义。挂马网页攻击是攻击者利用网站漏洞给网页加入恶意的代码,在用户未察觉的情况下载恶意软件来对用户进行攻击,而被添加了恶意代码的网页被称为挂马网页。一旦用户浏览了挂马网页,恶意的程序就会自动下载并执行,使用户的数据面临风险。除了添加恶意代码实现在用户浏览网页时下载恶意软件外,不法分子通过社会工程学原理,以欺骗的形式诱导用户下载运行有风险的软件。例如,网站诱导用户下载一个虚假的播放器软件以能够播放视频,但该软件其实是一个恶意软件。

挂马网页的检测分为三个步骤,首先需要收集网页的地址(即统一资源定位符,表示互联网上所以资源的位置和访问方法,是互联网上标准资源的地址,以下简称URL),然后使用较弱的过滤器快速过滤明显无害的网页,最后使用较强的网页分析工具对剩余的网页进行分析,找出挂马网页。收集网页的URL通常使用网络爬虫,网络爬虫是一种按照一定的规则,自动地获取万维网信息的程序。爬虫从给定的一组网页开始,分析网页上的超链接并尽可能多的访问网页,并下载网页信息。网络爬虫的获取的网页信息通常非常巨大,不适合使用较复杂的网页检测程序进行分类,所以需要一个速度快但效果较弱过滤器来过滤明显为正常的网页,以减少网页检测程序处理网页的数量。最后使用一个高准确度但速度较慢的网页检测程序,该程序是一种网页分析工具,该分析工具可采用蜜罐系统,模拟用户加载网页,并检测网页脚本语言(例如JavaScript)中的异常,从而找到含有恶意代码的网页,并将其标注出来。

现有的挂马网页检测方法,通过网络爬虫获取大量随机网页并通过机器学习分类等方法提取挂马网页的特征,利用此特征来对网页进行分类检测。这种方法的主要缺陷有:(1)面对现代互联网中的海量网页时,要分析出挂马网页的特征需要大量的样本进行机器学习,由于时间和计算机硬件资源是有限的,大量的资源花费在处理正常网页上,效率较低;(2)挂马网页变化速度快,传统的检测方法需要使用大量网页数据进行训练,训练周期较长,很难满足快速准确的挂马网页检测需求。

在现实中,通过网络爬虫随机获取的网页数据大多数都是正常网页,而与挂马网页相似的网页,很可能也是挂马网页。本发明针基于这一特点,通过分析挂马网页的特征,利用搜索引擎工具获取一些与挂马网页相似的网页,获取的网页中就会有较多的挂马网页,比传统的方法具有更高的检测效率。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种提高检测效率的使用引导型搜索的网页木马检测系统及方法。本发明的技术方案如下:

一种使用引导型搜索的网页木马检测系统,其包括外围程序模块和核心检测分析组件,外围程序模块包括一个网络爬虫模块,一个弱过滤器模块,一个网页检测模块和一个用于存储已知挂马网页的数据库;所述网络爬虫模块用于从互联网中下载网页,所述弱过滤器模块用于从下载的网页中过滤掉明显无害的网页,所述网页检测模块用于将挂马网页分类出来,数据库用于存储已知挂马网页;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711291684.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top