[发明专利]一种网页请求识别方法及装置有效
申请号: | 201711188652.2 | 申请日: | 2017-11-24 |
公开(公告)号: | CN109150817B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 孙松儿 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 请求 识别 方法 装置 | ||
本申请实施例提供了一种网页请求识别方法及装置,方法包括:提取多个样本网页请求的特征,确定每一样本网页请求的特征对应的特征向量;根据预定聚类算法和确定的特征向量,对所述多个样本网页请求进行聚类,针对每一聚类,根据该聚类包含的样本网页请求的特征向量,确定该聚类包含的样本网页请求的特征向量的中心向量,当获得待识别网页请求时,确定待识别网页请求所属的聚类,若待识别网页请求的特征向量与待识别网页请求所属的聚类的中心向量的距离不在待识别网页请求所属的聚类对应的预定距离范围内,则确定待识别网页请求为恶意网页请求。应用本申请实施例,降低了计算复杂度,提高了网页请求识别模型的训练速度。
技术领域
本申请涉及通信技术领域,特别是涉及一种网页请求识别方法及装置。
背景技术
恶意网页请求为攻击者进行攻击的一种形式。恶意网页请求利用网络服务的漏洞,通过问卷上传、跨站脚本、HTTP(HyperText Transfer Protocol,超文本传输协议)请求欺骗、SQL(Structured Query Language,结构化查询语言)注入等方式攻击网络服务器,达到窃取信息、瘫痪服务等目目的。
为了提高网络安全,保证服务质量,对准确的识别出恶意网页请求提出了要求。目前,网页请求识别的过程包括:获取大量带有标签的样本网页请求,从样本网页请求中提取特征向量,结合特征向量和样本网页请求的标签,训练网页请求识别模型,进而依据训练好的网页识别请求模型确定待识别网页请求是否为恶意网页请求。
上述训练网页请求识别模型时,需要大量的标签数据及样本网页请求,计算复杂度大,网页请求识别模型的训练速度较慢。
发明内容
本申请实施例的目的在于提供一种网页请求识别方法及装置,以降低计算复杂度,提高网页请求识别模型的训练速度。具体技术方案如下:
一方面,本申请实施例提供了一种网页请求识别方法,所述方法包括:
提取多个样本网页请求的特征;
确定每一样本网页请求的特征对应的特征向量;
根据预定聚类算法和确定的特征向量,对所述多个样本网页请求进行聚类;
针对每一聚类,根据该聚类包含的样本网页请求的特征向量,确定该聚类包含的样本网页请求的特征向量的中心向量;
当获得待识别网页请求时,确定所述待识别网页请求所属的聚类;
若所述待识别网页请求的特征向量与所述待识别网页请求所属的聚类的中心向量的距离不在所述待识别网页请求所属的聚类对应的预定距离范围内,则确定所述待识别网页请求为恶意网页请求。
二方面,本申请实施例提供了一种网页请求识别装置,所述装置包括:
提取单元,用于提取多个样本网页请求的特征;
第一确定单元,用于确定每一样本网页请求的特征对应的特征向量;
聚类单元,用于根据预定聚类算法和确定的特征向量,对所述多个样本网页请求进行聚类;
第二确定单元,用于针对每一聚类,根据该聚类包含的样本网页请求的特征向量,确定该聚类包含的样本网页请求的特征向量的中心向量;
第三确定单元,用于当获得待识别网页请求时,确定所述待识别网页请求所属的聚类;
识别单元,用于若所述待识别网页请求的特征向量与所述待识别网页请求所属的聚类的中心向量的距离不在所述待识别网页请求所属的聚类对应的预定距离范围内,则确定所述待识别网页请求为恶意网页请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711188652.2/2.html,转载请声明来源钻瓜专利网。