[发明专利]域名检测方法、模型训练方法及装置、设备、存储介质有效
申请号: | 202110253602.8 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112910925B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 梁李;张宾;张伟哲 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06F18/214;H04L61/4511;G06F16/951 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名 检测 方法 模型 训练 装置 设备 存储 介质 | ||
1.一种域名检测方法,其特征在于,所述域名检测方法包括以下步骤:
获取更新后的域名检测模型;其中,所述更新后的域名检测模型为根据定时爬取的恶意域名和历史训练样本集迭代训练得到,所述历史训练样本集包括恶意网页中的普通词汇特征向量、特定词汇特征向量和截图特征向量,所述恶意网页包括人工采集到的网页和所述恶意域名对应的网页;
根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果;
所述获取更新后的域名检测模型的步骤之前,还包括:
从所述恶意网页中获取普通词汇特征向量、特定词汇特征向量和截图特征向量;
将获取到的普通词汇特征向量、特定词汇特征向量和截图特征向量作为训练样本集,输入至神经网络中进行训练,得到原始的域名检测模型;
将最新爬取到的域名输入至所述原始的域名检测模型中,输出所述域名为恶意域名的概率值;其中,所述域名通过每隔预设时间段爬取网站得到或者根据设定时间点爬取网站得到;
将概率值大于预设阈值的域名添加至所述历史训练样本集中,以根据所述历史训练样本集对所述原始的域名检测模型进行再次训练,得到所述更新后的域名检测模型;
其中,从所述恶意网页中获取截图特征向量,包括:
通过预设脚本语言爬取多个所述恶意网页;
对所述恶意网页进行截图,得到多个所述恶意网页对应的截图;
对所述截图进行划分,得到多张子截图;
获取所述多张子截图的平均值;其中,所述平均值通过对所述子截图的图矩阵求取平均值得到;
根据所述多张子截图的平均值得到所述截图特征向量。
2.如权利要求1所述的域名检测方法,其特征在于,所述根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果的步骤之前,所述域名检测方法还包括:
获取黑名单;其中,所述黑名单中预置有多个恶意域名;
根据所述黑名单判断待检测域名是否为恶意域名;
若否,则执行根据所述更新后的域名检测模型对待检测域名进行检测,得到检测结果的步骤。
3.如权利要求1或2所述的域名检测方法,其特征在于,所述获取更新后的域名检测模型的步骤之前,所述域名检测方法还包括:
每隔预设时间段爬取网站上的域名;
将最新爬取到的域名输入至原始的域名检测模型中,输出所述域名为恶意域名的概率值;其中,所述原始的域名检测模型为根据历史训练样本集训练得到,所述历史训练样本集包括人工采集到的恶意网页中的普通词汇特征向量、特定词汇特征向量和截图特征向量;
将概率值大于预设阈值的域名添加至历史训练样本集中;
根据所述历史训练样本集对所述原始的域名检测模型进行再次训练,得到更新后的域名检测模型。
4.如权利要求3所述的域名检测方法,其特征在于,所述将最新爬取到的域名输入至原始的域名检测模型中,输出所述域名为恶意域名的概率值的步骤之前,还包括:
从人工采集到的恶意网页中获取普通词汇特征向量、特定词汇特征向量和截图特征向量;
将所述普通词汇特征向量、特定词汇特征向量和截图特征向量作为训练样本集,输入至神经网络中进行训练,得到原始的域名检测模型。
5.如权利要求4所述的域名检测方法,其特征在于,所述从人工采集到的恶意网页中获取普通词汇特征向量的步骤,包括:
通过预设脚本语言爬取多个恶意网页;
从所述多个恶意网页中获取文字,得到所述多个恶意网页对应的文字;
对所述多个恶意网页对应的文字进行切词处理,得到所述多个恶意网页对应的词汇;
将所述多个恶意网页对应的词汇输入至句向量神经网络中进行训练,得到所述多个恶意网页对应的词汇特征向量,以获取普通词汇特征向量。
6.如权利要求5所述的域名检测方法,其特征在于,所述对所述多个恶意网页对应的文字进行切词处理,得到所述多个恶意网页对应的词汇的步骤之后,还包括:
对所述多个恶意网页对应的词汇进行筛选,得到特定词汇;
从人工采集到的恶意网页中获取特定词汇特征向量的步骤,包括:
根据所述特定词汇,得到特定词汇特征向量,以获取特定词汇特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110253602.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:链式无级变速机构
- 下一篇:冷水机的控制方法、冷水机及存储介质