[发明专利]面向网页JavaScript恶意代码的智能检测方法有效

专利信息
申请号: 201210092707.0 申请日: 2012-03-31
公开(公告)号: CN102663296A 公开(公告)日: 2012-09-12
发明(设计)人: 范渊;陈铁明 申请(专利权)人: 杭州安恒信息技术有限公司;陈铁明
主分类号: G06F21/00 分类号: G06F21/00
代理公司: 杭州中成专利事务所有限公司 33212 代理人: 金祺
地址: 310051 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 网页 javascript 恶意代码 智能 检测 方法
【权利要求书】:

1.一种面向网页JavaScript恶意代码的智能检测方法,其特征在于,该方法包括优选样本、安全检测、更新优选三个过程,具体为:

优选样本:利用N-gram语言统计方法和机器学习算法KNN,通过对JavaScript脚本训练库中的JavaScript脚本进行机器学习,生成用于安全检测的JavaScript检测样本库;

安全检测:针对待检测的网页URL提取JavaScript脚本,基于优选样本过程建立的JavaScript检测样本库,通过KNN分类算法检测指定的网页是否包含JavaScript恶意代码;

更新优选:统计安全检测的正确率,若检测精度保持在设定的范围内,则持续启用经优选的JavaScript检测样本库执行安全检测;若检测精度下降超出预定范围,则将所有已完成检测并导致检测精度下降的JavaScript脚本置入JavaScript脚本训练库中,重新进行优选样本并得到更新的JavaScript检测样本库;该过程中,保持优选的检测样本库数量不变以保障安全检测的效率。

2.根据权利要求1所述的方法,其特征在于,所述JavaScript检测样本库包括恶意代码N-gram样本和良性代码N-gram样本。

3.根据权利要求1所述的方法,其特征在于,在所述优选样本的过程中,通过对训练脚本的分析确定如下参数:P,即JavaScript安全检测的正确率;N,即N-gram大小参数;Nf,即N-gram频率统计阈值,代表在JavaScript脚本训练库中出现频率最高的前Nf个N-gram;N°,即代表优选的JavaScript检测样本库中的恶意样本和良性样本的数量;

优选样本的具体包括如下步骤:

(1)采集当前具有代表性的JavaScript恶意脚本和良性脚本,形成达到万级数量的JavaScript脚本训练库;

(2)采用Google的开源JavaScript解析引擎V8,编译JavaScript脚本得到V8机器码,并进一步提取机器码的操作序列;

(3)以操作函数为基本单位,计算JavaScript脚本训练库中每一个恶意脚本和良性脚本的机器码操作序列的N-gram,并保存出现频率最高的前Nf个N-gram;

记恶意和良性脚本数量分别为nm和nb,脚本总量为n=nm+nb;将计算得到的每个脚本的Nf个N-gram集合记为(i=1,2,...,nm)和(i=1,2,...,nb),每个N-gram出现的频率值分别记为(i=1,2,...,nm)和(i=1,2,...,nb),这里对不在集合或中的N-gram s′,即规定i=1,2,...,nm

(4)选择KNN分类器(取K=1),分类算法描述如下:计算待分类JavaScript脚本机器码操作序列的前Nf个N-gram,记为集合Sf,每个N-gram出现的频率值记为f(s),s∈Sf;求出满足i=1,2,...,nm的i,并记为i=jm,求出满足i=1,2,...,nb的j,记为i=jb;若dm<db则判定该脚本为恶意代码,JavaScript脚本训练库中第jm个恶意脚本即被选作一次作为恶意的检测样本;否则为良性代码,第jb个良性脚本即被选作一次作为良性的检测样本;

(5)针对总量为n的JavaScript训练脚本库,采取KNN分类的交叉验证试验,具体是将训练脚本分别等分为和份(选择的nm和nb都为N°的倍数),随机各选择一份作为KNN训练数据,剩余部分全部作为测试数据;记录测试结果正确时,每个训练脚本被KNN分类器选作样本的累计次数;最后根据累计次数的高低,分别选择前N°个恶意脚本和良性脚本作为检测样本中的恶意样本和良性样本,并分别存储为N-gram集合,记为(i=1,2,...,N°)(恶意)和(i=1,2,...,N°)(良性),再记上述两个集合中各个N-gram的频率值分别为(i=1,2,...,N°)和(i=1,2,...,nb)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术有限公司;陈铁明,未经杭州安恒信息技术有限公司;陈铁明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210092707.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top