[发明专利]域名检测方法、模型训练方法及装置、设备、存储介质有效
申请号: | 202110253602.8 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112910925B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 梁李;张宾;张伟哲 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06F18/214;H04L61/4511;G06F16/951 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名 检测 方法 模型 训练 装置 设备 存储 介质 | ||
本发明公开了一种域名检测方法及装置、域名检测模型训练方法及装置、设备及存储介质。本发明通过获取更新后的域名检测模型;其中更新后的域名检测模型为根据定时爬取的恶意域名和历史训练样本集迭代训练得到,进而根据更新后的域名检测模型对待检测域名进行检测,得到检测结果;解决了相关技术中域名检测准确率低的问题。也即,本发明结合不断爬取到的恶意域名和历史训练样本集来对域名检测模型进行训练,以实时更新域名检测模型,使得得到的更新后的域名检测模型更为准确,因而利用该更新后的域名检测模型来对待检测域名进行检测的准确率也更高,即提升了域名检测准确率。
技术领域
本发明涉及数据处理领域,尤其涉及一种域名检测方法及装置、设备、域名检测模型训练方法及装置、设备、计算机可读存储介质。
背景技术
由于域名系统的关键性和脆弱性,域名系统成为众多攻击者的理想攻击目标,尤其是以恶意域名如钓鱼、外挂等作为承载体的攻击,其数量和威胁都在逐渐增加。
相关技术中,均是通过建立域名检测模型来检测域名是否为恶意域名,其中,域名检测模型在训练得到之后,并未进行更新,造成了域名检测准确率低的现象。
因此,如何提升域名检测准确率是亟待解决的问题。
发明内容
本发明的主要目的在于提供一种域名检测方法及装置、设备、域名检测模型训练方法及装置、设备、存储介质,旨在解决相关技术中域名检测准确率低的问题。
为实现上述目的,本发明提供一种域名检测方法,所述域名检测方法包括:
获取更新后的域名检测模型;其中,所述更新后的域名检测模型为根据定时爬取的恶意域名和历史训练样本集迭代训练得到;
根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果。
可选的,所述根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果的步骤之前,所述域名检测方法还包括:
获取黑名单;其中,所述黑名单中预置有多个恶意域名;
根据所述黑名单判断待检测域名是否为恶意域名;
若否,则执行根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果的步骤。
可选的,所述获取更新后的域名检测模型的步骤之前,所述域名检测方法还包括:
每隔预设时间段爬取网站上的域名;
将最新爬取到的域名输入至原始的域名检测模型中,输出所述域名为恶意域名的概率值;其中,所述原始的域名检测模型为根据历史训练样本集训练得到,所述历史训练样本集包括恶意网页中的普通词汇特征向量、特定词汇特征向量和截图特征向量;
将概率值大于预设阈值的域名添加至历史训练样本集中;
根据所述历史训练样本集对所述原始的域名检测模型进行再次训练,得到更新后的域名检测模型。
可选的,所述将最新爬取到的域名输入至原始的域名检测模型中,输出所述域名为恶意域名的概率值的步骤之前,还包括:
从人工采集到的恶意网页中获取普通词汇特征向量、特定词汇特征向量和截图特征向量;
将所述普通词汇特征向量、特定词汇特征向量和截图特征向量作为训练样本集,输入至神经网络中进行训练,得到原始的域名检测模型。
可选的,所述从人工采集到的恶意网页中获取普通词汇特征向量的步骤,包括:
通过预设脚本语言爬取多个恶意网页;
从所述多个恶意网页中获取文字,得到所述多个恶意网页对应的文字;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110253602.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:链式无级变速机构
- 下一篇:冷水机的控制方法、冷水机及存储介质