[发明专利]一种钓鱼网站的识别方法及装置在审

专利信息
申请号: 201710225325.3 申请日: 2017-04-07
公开(公告)号: CN108694321A 公开(公告)日: 2018-10-23
发明(设计)人: 王丹;王昱;马志远 申请(专利权)人: 武汉安天信息技术有限责任公司
主分类号: G06F21/57 分类号: G06F21/57;G06F17/30;H04L29/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 430000 湖北省武汉市东湖新技术开*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 钓鱼网站 敏感词 预定义 检测 计算资源 识别装置 网页文本 文本内容 文本元素 准确率 并合 网站 匹配 删除 混淆 钓鱼 消耗 对抗
【说明书】:

发明提供一种钓鱼网站的识别方法,在将提取的网页文本内容与钓鱼类预定义敏感词进行匹配之前,对文本元素的结构特征进行判断,若存在隐藏元素,则删除隐藏元素,提取并合并非隐藏元素的文本内容。本发明先主动的对待检测网站进行处理,针对性强,然后再结合预定义敏感词,这种方法能更好地对抗现有的混淆手段,提升钓鱼网站检测准确率。另外,整个方案仅消耗较少的计算资源,检测效率高。本发明还公开了一种钓鱼网站的识别装置。

技术领域

本发明涉及信息安全技术领域,尤其涉及一种钓鱼网站的识别方法及装置。

背景技术

时至今日,互联网已经成为人们社会生活重要的组成部分,但是伴随着互联网的不断普及和应用水平的不断提高,除了木马、病毒以及僵尸网络等传统的信息安全威胁以外,互联网钓鱼欺诈已经逐渐成为网络犯罪分子最主要的攻击手段之一。

钓鱼网站通常是指伪装成银行网站或电子商务网站、用以窃取用户提交的私人信息的网站。不法分子利用各种手段仿冒真实网站的统一资源定位符(UniformResourceLocator,简称URL)及页面内容,诱导用户访问仿冒的页面内容,以此来骗取用户输入的银行帐号、密码等私人信息。钓鱼网站的出现严重影响了在线金融服务的发展,破坏了公众使用互联网的信心。因此对钓鱼网站进行有效识别就成为互联网安全领域中的一项重要工作。

现有主要的钓鱼网站检测技术有:(1)向第三方域名注册网站查询目标网站的域名注册信息或者证书信息,通过对域名注册信息或证书信息的查验,判断目标网站是否为钓鱼网站。但是域名信息并不能直接反映钓鱼网站的页面特征,例如仿冒其他网站页面样式、显示诈骗信息等。现有方式只能是对钓鱼网站的域名信息进行规律总结,通过域名信息的规律性特点对钓鱼网站进行识别,因此这种方式的准确性较低。(2)基于网站内容的钓鱼网站识别技术,即提取网站中网页标题、标签内容等信息,然后与预定义规则进行匹配,若匹配成功,则判断为可疑钓鱼网站。这种方式比较被动,只适用于钓鱼网站制作变化不大的情况,预定义规则越丰富,则检测效果越好。然而,随着反钓鱼网站检测技术的不断发展,钓鱼网站制作者采用各种手段防止被检测,极大地增加了钓鱼网站的检测难度,比如通过在网页中增加不直接显示的文字类元素等等,依然单方面的依靠制定预定义规则而不对原钓鱼网站做些处理,已很难达到良好的检测效果。

发明内容

本发明的目的在于提供一种钓鱼网站的识别方法及装置,能对抗采用了混淆技术的钓鱼网站,检测效果好。

本发明公开了一种钓鱼网站检测方法,包括以下步骤:

S01,获取待检测网站的网页,提取网页源代码中的文本元素;

S02,判断所提取的文本元素是否为隐藏元素,当有文本元素为隐藏元素时,删除隐藏元素;

S03,提取并合并非隐藏元素的文本内容,将提取的文本内容与预定义敏感词进行匹配,若命中,则判断该网站为疑似钓鱼网站。

进一步的,在步骤S01前,获取待识别网站的域名,若该域名不满足预设的白名单,则获取待检测网站的网页。

进一步的,判断文本元素是否为隐藏元素的方法包括:提取文本元素中的样式属性信息,当存在表示该元素内容不在页面中显示的关键字时,判断当前文本元素为隐藏元素。

进一步的,若步骤S02中没有隐藏元素时,则直接进行步骤S03。

本发明还公开了一种钓鱼网站检测装置,包括文本元素提取模块、隐藏元素判断模块、识别判断模块,其中:

所述文本元素提取模块,用于获取待检测网站的网页,提取网页源代码中的文本元素;

所述隐藏元素判断模块,用于判断所提取的文本元素是否为隐藏元素,当有文本元素为隐藏元素时,删除隐藏元素;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉安天信息技术有限责任公司,未经武汉安天信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710225325.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top