[发明专利]基于动静态分离模板的客户端网页篡改检测方法有效

专利信息
申请号: 201810106150.9 申请日: 2018-02-02
公开(公告)号: CN108182370B 公开(公告)日: 2021-07-16
发明(设计)人: 孟雷;袁劲松;徐钟豪 申请(专利权)人: 上海斗象信息科技有限公司
主分类号: G06F21/64 分类号: G06F21/64;G06F16/958;G06F21/56
代理公司: 上海翰信知识产权代理事务所(普通合伙) 31270 代理人: 张维东
地址: 201203 上海市浦东新区碧波路6*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于动静态分离模板的客户端网页篡改检测方法,首先抓取同一URL在不同时间段下的网页源码,并训练得到动静态分离模板,检测时,将模板与待测网页匹配,识别出静态篡改点和动态区域,对动态区域根据模板中的动态区域统计特征信息做篡改检测,当待测网页与模板匹配提取动态区域时,若发现模板中的动态区域起始标识节点和/或结束节点在待测网页中被篡改,需要扩展模板中的对应动态区域,并重新统计扩展后的动态区域特征信息,根据xpath将篡改数据在待测网页上展示,本发明在客户端对网页篡改检测,具有资源开销低、部署简易、不受环境条件限制、适配性强优点,支持动态网页篡改检测,并可提高网页篡改整体检测准确性。
搜索关键词: 基于 静态 分离 模板 客户端 网页 篡改 检测 方法
【主权项】:
1.一种基于动静态分离模板的客户端网页篡改检测方法,其特征在于,包括以下步骤:步骤1,抓取同一URL在不同时间段的网页源码作为训练数据集;步骤2,对所述训练数据集进行预处理:将所述训练数据集中的每份网页源码解析为Dom Tree结构,以Dom Tree的每个标签为处理单元,将处理单元格式化,并将每个Dom Tree中的格式化的处理单元序列化为有序列表的形式,其中,所述格式化的处理单元中至少包括textnum、tag、hash、depth、sig和动态区域统计特征信息,textnum为处理单元文本数量、tag为标签名称、hash为处理单元的哈希值、deph为处理单元所在的深度值、sig表示处理单元是否为动态区域起始标识节点;步骤3,生成模板:提取所有预处理过的网页源码中最长公共子序列,根据所述最长公共子序列基于预定规则识别出静态区域、动态区域和动态区域起始标识节点,并统计动态区域统计特征信息,提取静态区域并根据静态区域中每个处理单元是否为动态区域起始节点对每个处理单元的sig值进行更新,根据统计出的动态区域特征信息对属于动态区域起始标识节点的处理单元的动态区域统计信息进行更新,将更新后的序列表作为模板;步骤4,抓取待测试的与步骤1中相同的URL的网页源码;步骤5,对步骤4中的网页源码进行预处理:预处理过程与步骤2的预处理过程相同,其中,格式化的处理单元中至少包括xpath、textnum、tag、hash、deph、sig和动态区域统计特征信息,xpath为每个处理单元的路径表达式,textnum为处理单元文本数量、tag为标签名称、hash为处理单元的哈希值、depth为处理单元所在的深度值、sig用于标识动静态区域;步骤6,提取步骤5中预处理的网页源码和所述模板的最长公共子序列,根据最长公共子序列基于预定规则识别出该两个序列表的静态区域、动态区域和动态区域起始标识节点,并统计各动态区域特征统计信息;步骤7,提取步骤6中静态区域并根据该静态区域中每个处理单元是否为动态区域起始节点对每个处理单元的sig值进行加1或加0,根据静态区域中处理单元的sig值来判断与其对应的动态区域是静态篡改点或是原始动态区域,若识别出模板中的动态区域起始标识节点和/或结束节点被篡改,则需要对模板中该动态区域进行动态区域扩展,并更新模板中动态区域统计信息,无论步骤6中的静态区域中对应的节点的sig值的大小,扩展的动态区域对应的步骤6中提取的动态区域均作为原始动态区域,并输出被篡改的静态区域数据;步骤8,根据原始动态区域和原始动态区域的动态区域特征统计信息、对应的模板中的动态区域和该动态区域的动态区域特征统计信息基于预定规则检测提取的原始动态区域是否被篡改;步骤9,输出被篡改的动态区域数据;步骤10,根据待测试的网页源码有序列表中各节点的xpath将被篡改的静态区域数据和动态区域数据在待测网页上展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斗象信息科技有限公司,未经上海斗象信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810106150.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top