[发明专利]一种基于登录框图像的钓鱼页面识别方法及相关设备有效
| 申请号: | 201810671860.6 | 申请日: | 2018-06-26 |
| 公开(公告)号: | CN110647895B | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 马长春 | 申请(专利权)人: | 深信服科技股份有限公司 |
| 主分类号: | G06F21/50 | 分类号: | G06F21/50;G06V10/764;G06V10/46;G06V10/82;H04L9/40 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 登录 框图 钓鱼 页面 识别 方法 相关 设备 | ||
1.一种基于登录框图像的钓鱼页面识别方法,其特征在于,包括:
分别提取预置安全登录框图像集合中的各个登陆框图像的SURF特征向量,并将每个登陆框图像的各个SURF特征向量关联存储,形成各自的标准SURF特征向量集合;
采集待检测登录页面的页面截图,并提取对应的SURF特征向量,形成第一SURF特征向量集合;
根据所述第一SURF特征向量集合与所述标准SURF特征向量集合,从至少两个维度判断所述待检测登录页面与各个安全登陆框图像的相似度,并根据各个维度的判断结果为所述待检测登录页面分配对应的权值;
统计所述待检测登录页面获得的权值之和,若权值之和不小于第三预置阈值,则判定所述待检测登录页面为钓鱼页面;
其中在所述采集待检测登录页面的页面截图之前,还包括:
采集待检测页面的页面信息,所述页面信息至少包括所述待检测页面对应的超文本标记语言HTML文件;从所述HTML文件中提取文件正文及统一资源定位符URL地址;统计所述HTML文件的文件正文中包含预置关键词汇的数量;判断所述HTML文件中的URL地址的个数,与文件正文的字节数的比值是否大于第四预置阈值,并根据判断结果为所述待检测页面分配第四权值;判断所述HTML文件中的文件正文中包含预置关键词汇的数量是否大于第五预置阈值,并根据判断结果为所述待检测页面分配第五权值;统计各项检测过程中所述待检测页面获得的权值之和,若权值之和不小于第六预置阈值,则判定所述待检测页面为待检测登录页面。
2.根据权利要求1所述的方法,其特征在于,所述从至少两个维度判断所述待检测登录页面与各个安全登陆框图像的相似度,并根据各个维度的判断结果为所述待检测登录页面分配对应的权值,包括:
若所述安全登录框图像集合对应的各个所述标准SURF特征向量集合中存在第二SURF特征向量集合,所述第二SURF特征向量集合与所述第一SURF特征向量集合中匹配成功的SURF特征向量的个数不小于第一预置阈值,则为所述待检测登录页面分配第一权值,其中,两个SURF特征向量相似度大于第二预置阈值则判定对应的SURF特征向量匹配成功;
判断所述第二SURF特征向量集合与所述第一SURF特征向量集合中匹配成功的SURF特征向量是否满足缩放映射,并根据判断结果为所述待检测登录页面分配第二权值。
3.根据权利要求2所述的方法,其特征在于,在统计所述待检测登录页面获得的权值之和之前,还包括:
判断所述第二SURF特征向量集合与所述待检测登录页面对应的域名是否相同,并根据判断结果为所述待检测登录页面分配第三权值。
4.根据权利要求1所述的方法,其特征在于,还包括:
所述待检测页面的页面信息登录页面截图,在统计所述待检测页面获得的权值之和之前,还包括:
将所述登录页面截图输入预置的卷积神经网络CNN分类器模型中进行分类,并根据分类结果为所述待检测页面分配第六权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810671860.6/1.html,转载请声明来源钻瓜专利网。





