[发明专利]一种网页探测方法及装置有效
申请号: | 201711278421.0 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108171082B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 岳炳词 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | G06F21/64 | 分类号: | G06F21/64;G06F16/958 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 张聪聪;马敬 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 探测 方法 装置 | ||
本发明实施例提供了一种网页探测方法及装置,方法包括:预先对原始网页进行采样,得到原始采样数据,将原始采样数据与网页的标识对应存储;当对网页进行探测时,在预先存储的原始采样数据中,获取待探测网页的标识对应的原始采样数据,并对待探测网页进行采样,得到当前采样数据,判断该原始采样数据与该当前采样数据是否相同,如果相同,确定待探测网页未被篡改。可见,本方案中将原始采样数据与当前采样数据进行对比,相比于现有方案中,将原始网页的全部内容与待探测网页的全部内容进行对比,减少了对比耗时,提高了探测效率。
技术领域
本发明涉及通信技术领域,特别是涉及一种网页探测方法及装置。
背景技术
在互联网应用中,通常会存在攻击者篡改网页的情况,因此,需要对网页进行探测,以判断网页是否被篡改,减少被篡改网页产生的危害。现有网页探测方案通常包括:预先将未被篡改的正常网页保存至缓冲区,当接收到用户发送的网页访问请求后,将用户请求访问的网页与缓冲区中保存的网页进行对比。如果缓冲区中保存的网页都与用户请求访问的网页不同,则表示用户请求的网页已被篡改。
上述方案中,将用户请求访问网页的全部内容与缓冲区中保存网页的全部内容进行对比,耗时较长,导致探测效率较低。
发明内容
本发明实施例的目的在于提供一种网页探测方法及装置,以提高探测效率。
为达到上述目的,本发明实施例提供了一种网页探测方法,包括:
确定待探测网页的标识;
在预先存储的原始采样数据中,获取所述标识对应的原始采样数据;
对所述待探测网页进行采样,得到当前采样数据;
判断所获取的原始采样数据与所述当前采样数据是否相同;
如果所述原始采样数据与所述当前采样数据相同,确定所述待探测网页未被篡改。
可选的,所述确定待探测网页的标识,可以包括:
接收用户终端发送的访问请求,将所述访问请求中携带的统一资源定位符URL确定为待探测网页的标识;
或者,每隔预设时间段,按照预设顺序依次将存储的各网页的URL确定为待探测网页的标识。
可选的,所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,可以包括:
在预先存储的原始网页数据长度中,获取所述标识对应的原始网页数据长度;
获取所述标识对应的待探测网页数据长度;
判断所获取的原始网页数据长度与所述待探测网页数据长度是否相同;
如果相同,则在预先存储的原始采样数据中,获取所述标识对应的原始采样数据。
可选的,所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,可以包括:
在预先存储的探测表项中,查找包含所述标识的探测表项;
如果查找到,读取查找到的探测表项中包含的原始采样数据;
如果未查找到,从备份服务器中获取所述标识对应的原始网页,对所述原始网页进行采样,得到原始采样数据。
可选的,所述确定待探测网页的标识,包括:读取用户终端发送的访问请求中携带的URL;若所读取的URL指向动态网页,则将所读取的URL中的动态序号调整为预设序号,将调整后的URL确定为待探测URL;
所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,可以包括:
在预先存储的原始采样数据中,获取所述待探测URL对应的原始采样数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711278421.0/2.html,转载请声明来源钻瓜专利网。