[发明专利]一种识别URL的方法和装置在审
申请号: | 201810517613.0 | 申请日: | 2018-05-25 |
公开(公告)号: | CN110535815A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 王建明;曹志文 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 11573 北京华智则铭知识产权代理有限公司 | 代理人: | 陈向敏<国际申请>=<国际公布>=<进入 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预设 属性信息 网页内容 恶意URL 匹配度 方法和装置 互联网安全 备案状态 访问请求 属性标准 识别率 归属 记录 | ||
本发明公开了一种识别URL的方法和装置,属于互联网安全技术领域。所述方法包括:当接收到对于未识别URL的访问请求时,记录所述未识别URL为可疑URL;判断所述可疑URL的属性信息是否符合预设的正常URL属性标准,其中,所述属性信息至少包括备案状态或归属者信息中的一项;如果符合,则标记所述可疑URL为正常URL,否则根据预设的恶意词名单计算所述可疑URL对应的网页内容的恶意匹配度;如果所述网页内容的恶意匹配度大于预设阈值,则标记所述可疑URL为恶意URL。采用本发明,可以降低恶意URL的漏识别率。
技术领域
本发明涉及互联网安全技术领域,特别涉及一种识别URL的方法和装置。
背景技术
为了维护网络安全,CDN系统中的鉴别服务端在接收到对于目标URL(UniformResource Locator,统一资源定位符)的访问请求时,可以基于已记录的恶意URL名单对目标URL进行识别,如果目标URL为恶意URL(即URL指向的内容包括暴力、色情、网络病毒等恶意信息),鉴别服务端则可以返回该目标URL为恶意URL的提示信息。
鉴别服务端可以对恶意URL名单进行更新。一方面,鉴别服务端可以每隔预设时长从网络上的恶意URL库获取最新的恶意URL,然后基于最新的恶意URL来更新恶意URL名单。另一方面,鉴别服务端可以接收用户反馈的恶意URL,然后基于接收的恶意URL来更新恶意URL名单。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于网络上的恶意URL库更新周期较长,数据量较少,且用户反馈的恶意URL的数量也较少,使得鉴别服务端往往无法通过上述途径更新的恶意URL名单,对最新出现的恶意URL进行识别,导致恶意URL的漏识别率较高。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种识别URL的方法和装置。所述技术方案如下:
一方面,提供了一种识别URL的方法,所述方法包括:
当接收到对于未识别URL的访问请求时,记录所述未识别URL为可疑URL;
判断所述可疑URL的属性信息是否符合预设的正常URL属性标准,其中,所述属性信息至少包括备案状态或归属者信息中的一项;
如果符合,则标记所述可疑URL为正常URL,否则根据预设的恶意词名单计算所述可疑URL对应的网页内容的恶意匹配度;
如果所述网页内容的恶意匹配度大于预设阈值,则标记所述可疑URL为恶意URL。
进一步的,所述当接收到对于未识别URL的访问请求时,记录所述未识别URL为可疑URL之前,还包括:
接收目标URL的访问请求,判断所述目标URL是否存在于URL黑名单;
如果存在,则标记所述目标URL为恶意URL,否则判断所述目标URL是否存在于URL白名单;
如果存在,则标记所述目标URL为正常URL,否则标记所述目标URL为未识别URL。
进一步的,所述属性信息还包括存在时长或访问量中的至少一项;
所述判断所述可疑URL的属性信息是否符合预设的正常URL属性标准,包括:
判断备案网站是否记录有所述可疑URL的备案信息,如果是,则判断所述可疑URL的属性信息符合预设的正常URL属性标准;
和/或,判断是否查询到所述可疑URL的归属者信息,如果是,则判断所述可疑URL的属性信息符合预设的正常URL属性标准;
和/或,判断所述可疑URL的存在时长是否大于预设存在时长且小于有效存在时长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810517613.0/2.html,转载请声明来源钻瓜专利网。