[发明专利]基于软件基因的安全防护软件测试集自动生成方法、架构在审

专利信息
申请号: 201910397360.2 申请日: 2019-05-14
公开(公告)号: CN111274123A 公开(公告)日: 2020-06-12
发明(设计)人: 王禹翔 申请(专利权)人: 上海戎磐网络科技有限公司
主分类号: G06F11/36 分类号: G06F11/36;G06F21/56;G06K9/62;G06N3/00;G06F8/53
代理公司: 上海宏京知识产权代理事务所(普通合伙) 31297 代理人: 赵霞
地址: 200336 上海市长宁区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 软件 基因 安全 防护 测试 自动 生成 方法 架构
【权利要求书】:

1.一种基于软件基因的安全防护软件测试集自动生成方法,其特征在于,所述方法包括以下步骤:

S1:准备待检测数据集的样本,提取所述样本中的软件基因代码片段;

S2:通过对比每一个样本的软件基因代码片段的相似性,对样本进行基于密度的聚类中心自动确定的混合属性数据聚类,形成多个不同大小的聚类;

S3:对每个聚类进行基于可变网格的密度偏差抽样,得到测试样本,把所有聚类中得到的测试样本进行汇总,得到测试样本集。

2.根据权利要求1所述的方法,其特征在于:所述步骤S1具体包括:

S11:输入样本,对样本进行反汇编得到待处理代码;

S12:获取所述待处理代码中调用系统API的代码所在的位置,以相邻的两条调用系统API的代码之间的部分作为一个软件代码基因片段,将所述待处理代码切割成为多个软件基因代码片段。

3.根据权利要求1所述的方法,其特征在于:步骤S2具体包括:

S21:从所述软件基因代码片段的数值型属性和分类型属性两个维度的数据进行计算,得出每个样本的位置和任意两个样本的距离;

S22:根据聚类中心自动确定方法和所述距离,计算得出聚类个数K和聚类中心;

S23:再结合粒子群算法,确定出每个聚类的最佳阶段距离;

S24:通过比较每个样本所在位置与每个聚类中心之间的距离,判断所述每个样本具体属于哪一个聚类。

4.根据权利要求1所述的方法,其特征在于:所述步骤S3具体包括:

S31:将每个聚类中软件基因代码片段的所述两个维度的数据进行排序,等深度将排序后的数据划分成多个网格单元;

S32:计算所述网格单元的密度信息,分别比较两个维度中的相邻网格单元的密度信息的相似性,合并密度信息相似的网格后形成网格空间;每个聚类相对应的形成一个网格空间,每个网格空间中包含不同数量的网格,每个网格中包含不同数量的样本。

S33:对每个网格空间内的样本进行抽取。

5.根据权利要求3所述的方法,其特征在于:所述步骤S24具体包括:

S241:比较样本与聚类的聚类中心之间的距离;

S242:当所述距离小于或者等于聚类的最佳阶段距离时,则找出所述样本所属的聚类;

S243:当所述距离大于聚类的最佳阶段距离时,再重复步骤S241和S242,直到找出所述样本所属的聚类。

6.根据权利要求4所述的方法,其特征在于:所述步骤S34具体包括:

S341:每个网格空间中包含多个网格,网格中所含样本的个数为该网格密度,抽取时,同一个网格中的样本抽取率相等,不同网格中的样本抽取率由其密度占比率决定,密度占比率越高的网格所抽取的样本数越多;

S342:网格空间中抽取出的样本为测试样本,将每个网格空间中所获得的测试样本进行汇总,得到测试样本集。

7.一种基于软件基因的安全防护软件测试集自动生成架构,其特征在于,所述架构包括:

预处理模块,用于提取待检测数据集的样本中的软件基因代码片段;

聚类分析模块,用于对比每一个样本的软件基因代码片段的相似性,对样本进行基于密度的聚类中心自动确定的混合属性数据聚类,形成多个不同大小的聚类;

抽样模块,用于对每个聚类进行基于可变网格的密度偏差抽样,得到测试样本,把所有聚类中得到的测试样本进行汇总,得到测试样本集。

8.根据权利要求7所述的一种基于软件基因的安全防护软件测试集自动生成架构,其特征在于:所述预处理模块包括反汇编子模块和切割子模块,

所述反汇编子模块用于对样本进行反汇编得到待处理代码;

所述切割子模块用于获取所述待处理代码中调用系统API的代码所在的位置,以相邻的两条调用系统API的代码之间的部分作为一个软件代码基因片段,将所述待处理代码切割成为多个软件基因代码片段。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海戎磐网络科技有限公司,未经上海戎磐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910397360.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top