[发明专利]一种网站检测方法、装置、计算机设备和存储介质有效

专利信息
申请号: 202110874958.3 申请日: 2021-07-30
公开(公告)号: CN113612765B 公开(公告)日: 2023-06-27
发明(设计)人: 周伟;程强;万月亮 申请(专利权)人: 北京锐安科技有限公司
主分类号: H04L9/40 分类号: H04L9/40;H04L41/142;H04L67/02
代理公司: 北京品源专利代理有限公司 11332 代理人: 马迪
地址: 100044 北京市海淀区西小口*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网站 检测 方法 装置 计算机 设备 存储 介质
【权利要求书】:

1.一种网站检测方法,其特征在于,包括:

获取待检测网站的动态网页表单,并从中提取表单特征;其中,所述表单特征包括统一资源标识和关键词列表;其中,关键词列表指动态网页表单信息key-value对中的key列表,关键词列表代表着动态网页表单的结构信息;

将所述表单特征输入至预先训练的基于规则的网页分类模型中,得到所述动态网页表单对应的网页的安全检测类型;

根据所述网页的安全检测类型,确定所述待检测网站的安全检测结果;

其中,在将所述表单特征输入至预先训练的基于规则的网页分类模型中之前,还包括:

基于规则的重复增量修枝算法,训练网页分类模型;

其中,所述基于规则的重复增量修枝算法,训练网页分类模型,包括:

获取训练样本集合,所述训练样本包括标注有网页类型的表单特征,所述网页类型包括安全类型和恶意类型;

将所述训练样本集合划分为成长集和修剪集;

根据所述成长集,基于规则的重复增量修枝算法,生成规则库;

根据所述修剪集,基于规则的重复增量修枝算法,调整所述规则库;

根据调整后的规则库确定网页分类模型。

2.根据权利要求1所述的方法,其特征在于,所述从中提取关键词列表,包括:

获取至少一个关键词列表;

按照关键词列表的顺序,对各所述关键词列表中的关键词并进行拼接,所述关键词包括数组中首位关键词,所述关键词包括父对象关键词和子对象关键词的拼接结果。

3.根据权利要求1所述的方法,其特征在于,所述根据所述网页的安全检测类型,确定所述待检测网站的安全检测结果,包括:

根据所述网页的安全检测类型,统计所述待检测网站的恶意网页检测结果的出现次数;

在所述出现次数满足多次出现条件的情况下,确定所述待检测网站为恶意网站。

4.根据权利要求3所述的方法,其特征在于,所述出现次数满足多次出现条件,包括:

在所述出现次数大于等于预设次数阈值的情况下,确定出现次数满足多次出现条件;或

在所述出现次数与网页检测总数之间的比值大于等于预设比值阈值的情况下,确定出现次数满足多次出现条件。

5.一种网站检测装置,其特征在于,包括:

表单特征获取模块,用于获取待检测网站的动态网页表单,并从中提取表单特征;其中,所述表单特征包括统一资源标识和关键词列表;其中,关键词列表指动态网页表单信息key-value对中的key列表,关键词列表代表着动态网页表单的结构信息;

网页安全检测模块,用于将所述表单特征输入至预先训练的基于规则的网页分类模型中,得到所述动态网页表单对应的网页的安全检测类型;

网站安全检测模块,用于根据所述网页的安全检测类型,确定所述待检测网站的安全检测结果;

其中,网站检测装置,还包括:

网页分类模型训练模块,用于基于规则的重复增量修枝算法,训练网页分类模型;

其中,所述网页分类模型训练模块,包括:

训练样本集合获取单元,用于获取训练样本集合,所述训练样本包括标注有网页类型的表单特征,所述网页类型包括安全类型和恶意类型;

训练样本集合划分单元,用于将所述训练样本集合划分为成长集和修剪集;规则库生成单元,用于根据所述成长集,基于规则的重复增量修枝算法,生成规则库;

规则库调整单元,用于根据所述修剪集,基于规则的重复增量修枝算法,调整所述规则库;

网页分类模型确定单元,用于根据调整后的规则库确定网页分类模型。

6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一所述的网站检测方法。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的网站检测方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110874958.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top