[发明专利]URL异常定位方法、装置、服务器及存储介质有效
申请号: | 201810182571.X | 申请日: | 2018-03-06 |
公开(公告)号: | CN108366071B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 张雅淋;李龙飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | url 异常 定位 方法 装置 服务器 存储 介质 | ||
1.一种URL异常定位方法,包括:
对URL的参数请求部分进行字段切分,得到由对应各个字段的各个示例组成的多示例包,其中,示例由对应字段的特征向量表示;
将所述多示例包输入基于多示例学习的URL异常定位模型,通过预测各个示例的异常标记的值,确定异常示例,其中,异常示例和非异常示例通过示例的异常标记的值进行区分;
根据异常示例定位出对应的异常字段。
2.根据权利要求1所述的方法,还包括:
基于多示例学习算法对多个URL样本进行训练,得到所述URL异常定位模型。
3.根据权利要求2所述的方法,所述基于多示例学习算法对多个URL样本进行训练,得到所述URL异常定位模型,包括:
对URL样本集中各个URL样本的参数请求部分进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;
集合各个URL样本的多示例包得到多示例包集;
基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练;
基于所述分类训练,得到所述URL异常定位模型。
4.根据权利要求3所述的方法,所述对多示例包集进行异常示例及非异常示例分类训练包括:
对多示例包集中每个示例的异常标记的值进行初始化,并对异常标记的值进行迭代学习,更新调整出每个示例最终的异常标记的值。
5.根据权利要求1-4任一项所述的方法,还包括:
确定所述URL是否为异常URL:
如果所述URL对应的示例包中包括异常示例,则确定所述URL为异常URL;
如果所述URL对应的示例包中不包括异常示例,则确定所述URL为非异常URL。
6.一种URL异常定位训练方法,包括:
收集由多个URL样本组成的URL样本集;
对URL样本集中各个URL样本的参数请求部分进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包,其中,示例由对应字段的特征向量表示;
集合各个URL样本的多示例包得到多示例包集;
基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练,其中,异常示例和非异常示例通过示例的异常标记的值进行区分;
基于所述分类训练,得到所述URL异常定位模型;
其中,所述对多示例包集进行异常示例及非异常示例分类训练包括:
对多示例包集中每个示例的异常标记的值进行初始化,并对异常标记的值进行迭代学习,更新调整出每个示例最终的异常标记的值。
7.一种URL异常定位装置,包括:
切分单元,用于对URL的参数请求部分进行字段切分,得到由对应各个字段的各个示例组成的多示例包,其中,示例由对应字段的特征向量表示;
预测单元,用于将所述多示例包输入基于多示例学习的URL异常定位模型,通过预测各个示例的异常标记的值,确定异常示例,其中,异常示例和非异常示例通过示例的异常标记的值进行区分;
定位单元,用于根据异常示例定位出对应的异常字段。
8.根据权利要求7所述的装置,还包括:
模型训练单元,用于基于多示例学习算法对多个URL样本进行训练,得到所述URL异常定位模型。
9.根据权利要求8所述的装置,所述模型训练单元,包括:
样本切分在单元,用于对URL样本集中各个URL样本的参数请求部分进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;
示例包集合子单元,用于集合各个URL样本的多示例包得到多示例包集;
训练子单元,用于基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练,得到所述URL异常定位模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810182571.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于提供媒体内容的方法和客户端
- 下一篇:一种支持语音加密搜索的云存储方法