[发明专利]基于文件指令序列的计算机恶意程序分类系统和分类方法有效
申请号: | 200910040997.2 | 申请日: | 2009-07-10 |
公开(公告)号: | CN101604364A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 叶艳芳;黄锴;梁飞;朱文祥 | 申请(专利权)人: | 珠海金山软件股份有限公司 |
主分类号: | G06F21/00 | 分类号: | G06F21/00;G06F17/30 |
代理公司: | 广州新诺专利商标事务所有限公司 | 代理人: | 杨焕军 |
地址: | 519015广东省珠海市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于文件指令序列的计算机恶意程序分类系统及其方法。基于文件指令序列的计算机恶意程序分类系统包括:指令序列特征提取模块,其生成指令片段的集合;样本文件差异度计算模块,其计算两个样本点之间的差异度;维度权值计算模块,其计算每个家族中各个维度的权值及各家族的维度权值向量;样本分家族模块,其调用上述各模块完成对所有样本点进行分家族工作。上述装置可根据文件指令序列对恶意程序样本进行合理分家族。 | ||
搜索关键词: | 基于 文件 指令 序列 计算机 恶意程序 分类 系统 方法 | ||
【主权项】:
1、一种基于文件指令序列的计算机恶意程序分类系统,其特征在于,包括指令序列特征提取模块,其首先将样本文件脱壳,提取样本文件中所包含的所有函数,并剔除函数中的操作数,只保留汇编指令,然后以函数为单位,将每个函数的指令序列隔指定的步长进行切片,统计每个样本文件出现的指令片段,生成一个指令片段的集合,作为样本文件的特征表征;样本文件差异度计算模块,其计算两个恶意程序样本文件之间的差异度,其计算公式为:WJD mn = w m · X m ∪ w n · X n - w m · X m ∩ w n · X n w m · X m ∪ w n · X n ]]> ----公式(1)在公式(1)中,wm和wn分别指的是文件m和文件n所在家族的权值向量,WJDmn表示文件m和文件n之间的差异度,Xm与Xn分别表示文件m和文件n的特征向量;维度权值计算模块,其计算每个家族中各个维度的权值,其计算公式为:
——公式(2)从而得到家族i的权值向量为wi=[wi1,wi2,...,wid]——公式(3)公式(2)中,wij表示家族i中第j维的权值;d为样本全集的维度总数;D ij = Σ x i ∈ X i W ij ′ ( x ij - c ij ) 2 ]]> 表示家族i中的所有样本点与该家族的中心点ci在第j维上的偏差;cij表示家族i的中心点ci第j维的值,xij表示家族i中的样本点xi第j维的值;w′ij为上一次迭代过程中的wij;E ij = Σ x k ∉ X i w ij ′ ( x kj - c ij ) 2 ]]> 表示家族i以外的其它家族中的所有样本点与家族i的中心点ci在第j维上的偏差;xkj表示家族i以外的其它家族的样本点xk第j维的值;样本分家族模块,其调用上述各模块完成对所有样本点进行分家族工作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山软件股份有限公司,未经珠海金山软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910040997.2/,转载请声明来源钻瓜专利网。