[发明专利]一种钓鱼网站鉴别系统和方法有效
申请号: | 201310477276.4 | 申请日: | 2013-10-12 |
公开(公告)号: | CN103544436B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 张巍;姜青山 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙)44316 | 代理人: | 沈祖锋,郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 钓鱼 网站 鉴别 系统 方法 | ||
技术领域
本发明涉及网络安全技术领域,尤其涉及一种钓鱼网站鉴别系统和方法。
背景技术
随着互联网的迅速发展和信息化进程的深入,人们的工作、学习和生活方式与互联网的结合已变得越来越紧密,即时通信、电子邮件、电子商务、网络游戏、网上办公等与人们的日常生活息息相关。但是,紧随信息化发展而来的信息安全问题也已日渐凸出,网络犯罪层出不穷。网络钓鱼是最为严重的互联网犯罪形式之一,在近几年频繁出现。所谓“钓鱼网站”,是指不法分子利用各种手段,仿冒真实网站的地址以及页面内容,或者利用真实网站服务器程序上的漏洞,在站点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资料。在巨大经济利益的诱惑下,钓鱼网站已逐步显现出较为完整的“产业链”。在这个产业链中,建设钓鱼网站轻而易举,只要申请一个域名,很快就能建一个伪装成银行网站或电子购物网站的钓鱼网站,一般二、三百元就可以做一个。与此同时,钓鱼网站具有相当强的欺骗性,以假淘宝举例介绍说,不仅用假网站骗买家,更有骗卖家的。比如,给客服发个假链接,一旦打开,卖家的支付宝账号、密码即有可能被窃。网络钓鱼的日渐猖撅,已严重影响到在线金融服务和电子商务的发展,也时刻危害公众利益。
在中国互联网络中,中文钓鱼网站的数量也逐渐频繁地增加出现,严重损害了电子商务以及金融在线服务的发展,为公共利益带来了严重的危害,打击了公众互联网用户对网络应用上的信心与支持。由于互联网的基本特性,中文钓鱼网站的来源以及带来的危害已经超越国界,逐渐成为了一个让全球互联网用户关注并担忧的问题。
目前,钓鱼网站的防御与识别方法主要包括人工举报、基于黑名单技术及基于网站的启发式识别等,其中:
(1)人工举报与识别
在反钓鱼技术大面积应用前的早期阶段,由于钓鱼网站的数量、种类比较少,反釣鱼也基本是借助人工进行识别。随着技术的更新,举报方式的反釣鱼模式逐渐变为辅助手段。但是,对于一些特殊钓鱼站点的识别,人工方式还是有其独特的作用。对于钓鱼网站URL的举报与校验,一些开源举报组织已做的非常完善,同一条记录由多个志愿者共同识别后。识别率以及准确度都可达到相当高的水平。
(2)基于黑名单的检测技术
基于黑名单的检测技术采用URL地址黑名单对比的方式来进行钓鱼网站的检测拦截,当用户每次进行互联网网页访问的时候,钓鱼检测系统就将访问的URL与黑名单数据库中的URL地址进行匹配对比,如果匹配成功之后就会向用户显示钓鱼网站的警告,同时拦截用户对该页面的访问。黑名单匹配的方法存在的一个缺陷就是:它仅仅可以检测识别已知的有害网站及其发布者,对新的钓鱼攻击威胁则无能为力,这直接导致这种传统检测拦截方法的成功率较低。
(3)基于启发式的识别技术
基于启发式的识别技术是一种利用机器学习算法对页面进行识别分类的方法,通过对大量的钓鱼网站样本进行分析处理,从中提取出最能够表现钓鱼网站页面的各种特征,然后利用统计机器学习方法,模式识别与数据挖掘等技术,对待判定的未知网站进行分类,判别其是否为钓鱼网站。由于钓鱼站点的URL与合法站点的URL具有许多明显的差异,如主机域名或者某些特定的敏感词,因此可以使用URL的域名、URL类型包含字段以及PageRank进行建模。提取站点页面的特征是也是比较常用的一种方法,这些特征包括页面的内容文字、DOM结、HTML中链接的属性等。钓鱼网站的页面中此类特征与合法站点的页面因为具有较为明显的区别,因此也可以用于钓鱼网站的分类鉴别。
然而,目前检测钓鱼网站的研究方法与技术仍存在着一些问题:1)人工举报与识别需要借助个人的经验,并且效率比较低;2)基于黑名单的检测技术只能识别在黑名单中的钓鱼网站,而对于层出不穷的新钓鱼网站则无法准确识别;3)基于启发式的识别技术误报率较高,因为需要准确提取出能够代表网站信息的特征,而现有方法还不完善。另外,当前反钓鱼研究基本都集中在对英文钓鱼网站的识别,对中文钓鱼网站检测研究较少,因此需要对中文钓鱼网站进行全面研究,提取出适合中文钓鱼网站的特征表征与特征提取方法,进而对中文钓鱼网站进行分析,采取合理的分类方法进行鉴别,提高检测的准确率。
发明内容
针对上述问题,本发明的目的是提供一种可解决上述技术问题的钓钓鱼网站鉴别系统和方法。
一种钓鱼网站鉴别系统,其包括:
页面爬取模块,用于爬取网站的页面源代码,并提取网站的中文文本及网站的内/外链接数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310477276.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据驱动的自适应接收链分集处理
- 下一篇:一种控制方法及电子设备