[发明专利]利用空间混合索引机制检测钓鱼网页的方法有效
申请号: | 201210057731.0 | 申请日: | 2012-03-07 |
公开(公告)号: | CN102662959A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 张卫丰;王慕妮;周国强;张迎周;田先桃;周国富;陆柳敏;许碧欢;顾赛赛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 空间 混合 索引 机制 检测 钓鱼 网页 方法 | ||
技术领域
本发明涉及一种钓鱼网页检测的方法,主要从网页视觉布局相似性角度,同步结合网页的文本特征、图像特征及空间布局特征,基于空间混合索引机制对钓鱼网页进行匹配和识别,属于信息安全领域。
背景技术
钓鱼网站是随着网络普及和在线交易增加而变得异常猖獗的网络诈骗行为。钓鱼网站是犯罪分子做出的诈骗网站,钓鱼网站通常与银行网站或其他知名网站几乎完全相同,从而引诱网站使用者在钓鱼网站上提交出敏感信息,如:用户名、口令、银行帐号或信用卡详细信息等[Zhang2007]。
最典型的网络钓鱼攻击过程如下:首先将用户引诱到一个通过精心设计与目标组织的网站非常相似的钓鱼网站上,然后获取用户在该钓鱼网站上输入的个人敏感信息,例如银行帐号、银行密码等。通常这个攻击过程不会让受害者警觉。这些个人信息对钓鱼网站持有者具有非常大的吸引力,通过使用窃取到的个人信息,他们可以假冒受害者进行欺诈性金融交易,获得极大的经济利益,而受害者们却因此而遭受到巨大的经济损失,非但如此,被窃取的个人信息还可能被用于其他非法活动。如何识别钓鱼网站,如何保证网站信息传输的保密完整性,愈发的显示出其重要性和必要性。
当前钓鱼网站识别主要靠计算机自动识别和人工识别两种方式,人工识别采用黑名单机制,用户对某个网站进行举报,通过人工鉴定是否为钓鱼网站,这样显然速度太慢。计算机自动识别目前主要是基于页面视觉相似性检测方式判断是否为钓鱼网站,电脑通过抽取网页的视觉、文字特征与大多数主要的合法网站页面进行相似度对比或进行机器学习,从而判断是否为钓鱼网站。
大多数用户会受骗,很多时候是由于钓鱼网页总是与真实网页有高度的相似性。计算相似性的方法很多,文献[Liu2005,Fu2006,Chen2009,Afroz2009]。
空间数据库是一种在地理信息方面应用较多的空间查询技术,采用R树为数据结构。由于网页布局特征信息需要查找视觉上靠近的所有矩形,这里结合空间数据库存储网页的特征,可以快速获取特征库中所有视觉上相似以及位置上靠近的布局特征。
[Zhang2007]Y.Zhang,J.Hong,and L.Cranor.Cantina:A content-based approach to detecting phishing websites.WWW,2007.
[Fu2006]Anthony Y.Fu,Wenyin Liu,Xiaotie Deng.Detecting Phishing Web Pages with Visual Similarity Assessment based on Earth Mover’s Distance(EMD).IEEE Transactions on Dependable and Secure Computing,2006,3(4),pages 301-311.
[Liu2005]W.Liu,G.Huang,X.Liu,M.Z,and X.Deng.Detection of Phishing Webpages Based on Visual Similarity.International World Wide Web Conference,2005,pp.1060-1061.
[Chen2009]K.-T.Chen,J.-Y.Chen,C.-R.Huang,and C.-S.Chen.Fighting Phishing with Discriminative Keypoint Features of Webpages.IEEE Internet Computing,2009.
[Afroz2009]Sadia Afroz and Rachel Greenstadt.Phishzoo:An Automated Web Phishing Detection Approach Based on Profiling and Fuzzy Matching.Technical Report DU-CS-09-03,Drexel University,2009.
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210057731.0/2.html,转载请声明来源钻瓜专利网。