[发明专利]恶意网页的识别方法以及识别装置有效
申请号: | 201110345080.0 | 申请日: | 2011-11-04 |
公开(公告)号: | CN102339320A | 公开(公告)日: | 2012-02-01 |
发明(设计)人: | 蒋柏梁;付凯;陈超;李亚文 | 申请(专利权)人: | 成都市华为赛门铁克科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611721 四川省成都市高新区西部园区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 网页 识别 方法 以及 装置 | ||
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种恶意网页的识别方法及一种恶意网页的识别装置。
背景技术
网络技术的快速发展、普及,以及网络资源的极大丰富,在满足了人们日常学习和娱乐需求的同时,也给社会带来了一些潜在问题和危害,例如日益泛滥的暴力网站、色情网站、携带有病毒的网页等等。这些问题不仅会使我们的个人计算机面临极大的风险,同时也对青少年成长造成不利影响。
针对上述问题,统一资源定位符(URL,Uniform Resource Locator)过滤技术应运而生,网络中提供的共享资源通常是通过URL来定位的,因此通过对用户访问请求中对应着非法资源的URL进行识别和过滤,可以达到避免用户访问非法资源的目的。例如对某些非法网站,运营商从网络侧配置策略对其进行告警或阻断,从而防止用户访问非法网站。但是该方案对于同一个网站中,既有合法的正常网页URL、又有非法的恶意网页URL的情况就不适用了。原因如下:网页的URL通常由“网站的URL+该网站上的页面标识”组成,如果为了限制用户访问恶意网页URL而将网站的URL加入黑名单中,将会导致用户无法访问包括正常网页URL在内的该网站的所有链接。
由于一个网站通常会提供数以千计的网页,与网站URL的数目相比较,网页URL的数目多得多,如果仍旧采用黑名单的方式来存储恶意网页URL,将会占用大量存储空间;并且,在从用户的网络访问请求中提取待访问网页的URL后,将提取的URL与黑名单中的恶意网页URL进行匹配时,占用的系统资源较大,匹配效率较低。
针对上述问题,现有技术提出了关键词过滤技术的设想。其中,关键词由至少两个关键字组成,只有当待访问网页的URL匹配上了一个关键词中的所有关键字时(即待访问网页的URL中包含该关键词中的每个关键字),确定该URL匹配中了该关键词。但是,现有技术并没有提供一种能够高效的关键词过滤技术的具体方案。
发明内容
本发明实施例提供一种恶意网页的识别方法,用以解决在同一网站提供的网页中,既有正常网页又有恶意网页的情况下,现有技术无法在过滤掉恶意网页的同时,允许用户访问正常网页的问题。
对应地,本发明实施例还提供了一种恶意网页的识别装置。
本发明实施例提供的技术方案如下:
一种恶意网页的识别方法,包括:
将待访问网页URL与恶意关键词表中的关键字进行匹配,记录匹配结果,所述恶意关键词表中顺序存储有每个关键词包含的至少两个关键字、各关键字在所属关键词中的顺序号;所述匹配结果中包含匹配到的关键字、以及关键字的顺序号;
从匹配结果中选择基准关键字,所述基准关键字的顺序号标识该关键字为所属关键词中的第一个关键字;
若基准关键字的数目为至少一个,则对于每个选择出的基准关键字,执行以下步骤:
获得匹配结果中以所述基准关键字为起点的一组关键字,该组关键字中每个关键字的顺序号与前一个关键字的顺序号连续;
判断该组关键字的数目,与该基准关键字所属关键词所包含的关键字的数目是否一致;若数目一致,则确认所述待访问网页URL中包含该基准关键字所属关键词,为恶意网页URL。
一种恶意网页的识别装置,包括:
匹配单元,用于将待访问网页URL与恶意关键词表中的关键字进行匹配,记录匹配结果,所述恶意关键词表中顺序存储有每个关键词包含的至少两个关键字、各关键字在所属关键词中的顺序号;所述匹配结果中包含匹配到的关键字、以及关键字的顺序号;
选择单元,用于从匹配结果中选择基准关键字,所述基准关键字的顺序号标识该关键字为所属关键词中的第一个关键字;
获取单元,用于若选择单元选择出的基准关键字的数目为至少一个,则对于每个选择出的基准关键字,获得匹配结果中以所述基准关键字为起点的一组关键字,该组关键字中每个关键字的顺序号与前一个关键字的顺序号连续;
判断单元,用于判断该组关键字的数目,与该基准关键字所属关键词所包含的关键字的数目是否一致;
第一确认单元,用于若判断单元判断结果为是,则确认所述待访问网页URL中包含该基准关键字所属关键词,为恶意网页URL。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市华为赛门铁克科技有限公司,未经成都市华为赛门铁克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110345080.0/2.html,转载请声明来源钻瓜专利网。