[发明专利]URL异常定位方法、装置、服务器及存储介质有效
申请号: | 201810182571.X | 申请日: | 2018-03-06 |
公开(公告)号: | CN108366071B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 张雅淋;李龙飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | url 异常 定位 方法 装置 服务器 存储 介质 | ||
本说明书实施例提供了一种URL异常定位方法,通过对URL表示为多个示例组成的包,并利用URL异常定位模型对异常示例进行预测,从而定位出URL中的异常字段。基于多示例学习的URL异常定位,能够较好的预测出数据中未发现的潜在威胁。
技术领域
本说明书实施例涉及互联网技术领域,尤其涉及一种URL异常定位方法、装置、服务器及存储介质。
背景技术
在互联网的应用场景中,每天会有大量的对于网址URL(Uniform ResourceLocator,统一资源定位符)的访问;与此同时,不乏不法分子试图通过不合法的URL访问进行攻击。
发明内容
本说明书实施例提供及一种URL异常定位方法、装置、服务器及存储介质。
第一方面,本说明书实施例提供一种URL异常定位方法,包括:对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;根据异常示例定位出对应的异常字段。
第二方面,本说明书实施例提供一种URL异常定位训练方法,包括:收集由多个URL样本组成的URL样本集;对URL样本集中各个URL样本进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;集合各个URL样本的多示例包得到多示例包集;基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练;基于所述分类训练,得到所述URL异常定位模型。
第三方面,本说明书实施例提供一种URL异常定位装置,包括:切分单元,用于对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;预测单元,用于将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;定位单元,用于根据异常示例定位出对应的异常字段。
第四方面,本说明书实施例提供一种URL异常定位训练装置,包括:样本获取单元,用于收集由多个URL样本组成的URL样本集;样本切分单元,用于对URL样本集中各个URL样本进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;示例包集合单元,用于集合各个URL样本的多示例包得到多示例包集;训练单元,用于基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练,得到所述URL异常定位模型。
第五方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述方法的步骤。
第六方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
本说明书实施例有益效果如下:
在本说明书实施例中,通过对URL表示为对应多个字段的多个示例组成的包,利用URL异常定位模型对异常示例进行预测,从而定位出URL中的异常字段。基于多示例学习的URL异常定位,能够较好的预测出每天的访问数据中未发现的潜在威胁,由于可以针对异常URL确定异常所在,从而可为发现潜在威胁、建立新的安全规则、构建安全系统提供巨大的支持。
附图说明
图1为本说明书实施例的URL异常定位场景示意图;
图2为本说明书实施例第一方面的URL异常定位方法流程图;
图3为本说明书实施例第二方面的URL异常定位训练方法流程图;
图4为本说明书实施例第三方面的URL异常定位装置结构示意图;
图5为本说明书实施例第四方面的URL异常定位训练装置结构示意图;
图6为本说明书实施例第五方面提供的URL异常定位服务器结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810182571.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于提供媒体内容的方法和客户端
- 下一篇:一种支持语音加密搜索的云存储方法