[发明专利]钓鱼邮件识别方法、系统、设备及存储介质在审
申请号: | 202110731826.5 | 申请日: | 2021-06-28 |
公开(公告)号: | CN115603926A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 宁阳;闫凡;郜振锋;郑景中;王雄;许云中 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 郝怀庆 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 钓鱼 邮件 识别 方法 系统 设备 存储 介质 | ||
本发明公开了钓鱼邮件识别方法、系统、设备及存储介质,该方法包括:获取待检测邮件中的目标网页链接地址;获取所述目标网页链接地址对应的目标页面的页面参数;获取所述页面参数与预设页面参数的相似度;在所述相似度大于预设相似度阈值时,判定所述待检测邮件为钓鱼邮件。本发明实现了对邮件中模仿合法网页链接地址的钓鱼邮件的准确识别。
技术领域
本发明涉及信息安全技术领域,尤其涉及一种钓鱼邮件识别方法、系统、设备及存储介质。
背景技术
随着互联网的快速发展,现已成为了人们工作中至关重要的通信手段,然而在电子邮件快速普及的同时,网络欺诈手段也愈发猖獗,其中,钓鱼邮件最为典型。钓鱼邮件是指利用伪装的电邮,欺骗收件人将账号、口令等信息回复给指定的接收者;或引导收件人连接到特制的网页,这些网页通常会伪装成和真实网站一样,如银行或理财的网页,令登录者信以为真,输入信用卡或银行卡号码、账户名称及密码等而被盗取。
针对于钓鱼邮件的遏制,目前已经出现了用于检测钓鱼邮件检测技术,这种钓鱼邮件检测技术通常是对邮件头以及附件进行检测,往往容易产生错误检测的情况,准确性差。
发明内容
本申请实施例通过提供一种钓鱼邮件识别方法、系统、设备及存储介质,旨在解决现有的钓鱼邮件检测技术检测准确性差的问题。
本申请实施例提供了一种钓鱼邮件识别方法,所述钓鱼邮件识别方法,包括:
获取待检测邮件中的目标网页链接地址;
获取所述目标网页链接地址对应的目标页面的页面参数;
获取所述页面参数与预设页面参数的相似度;
在所述相似度大于预设相似度阈值时,判定所述待检测邮件为钓鱼邮件。
在一实施例中,所述获取待检测邮件中的目标网页链接地址的步骤,包括:
获取所述待检测邮件的邮件内容;
若检测到所述邮件内容中包含有与预设正则表达式的格式匹配的字符串,则获取所述邮件内容中的网页链接地址,以得到所述目标网页链接地址。
在一实施例中,所述获取所述邮件内容中的网页链接地址,以得到所述目标网页链接地址的步骤,包括:
删除获取到的所述网页链接地址中与预设网页链接地址的域名相同的网页链接地址,得到所述目标网页链接地址。
在一实施例中,所述删除获取到的所述网页链接地址中与预设网页链接地址的域名相同的网页链接地址,得到所述目标网页链接地址的步骤之前,还包括:
对获取到的所述网页链接地址进行去重处理。
在一实施例中,所述获取所述页面参数与预设页面参数的相似度的步骤,包括:
分别确定所述页面参数与所述预设页面参数的交集和并集;
获取所述交集和所述并集的相似度。
在一实施例中,所述获取所述页面参数与预设页面参数的相似度的步骤,还包括:
对所述页面参数进行向量化处理得到第一页面参数向量,对所述预设页面参数进行向量化处理得到第二页面参数向量;
根据所述第一页面参数向量以及所述第二页面参数向量确定所述相似度。
在一实施例中,所述获取所述页面参数与预设页面参数的相似度的步骤,还包括:
获取所述页面参数对应的第一页面图片和所述预设页面参数对应的第二页面图片;
提取所述第一页面图片和所述第二页面图片之间匹配的图片特征点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110731826.5/2.html,转载请声明来源钻瓜专利网。