[发明专利]一种基于软件网络的缺陷高风险模块的识别方法有效
申请号: | 201910318037.1 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110147321B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 艾骏;杨益文;苏文翥;王飞;郭皓然;邹卓良 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于软件网络的缺陷高风险模块识别方法,属于软件复杂网络领域。包括:步骤一,构建自适应分类器,自适应分类器中包含多个分类器;步骤二,进行自适应特征选择;步骤三,进行自适应阈值寻优;步骤四,进行自适应分类器内部参数调优;步骤五,进行自适应最优预测模型的选择,然后利用最优预测模型对待测软件网络进行缺陷高风险模块识别。本发明方法无论针对何种类型的缺陷数据集,都能根据数据集自身的特点完成自适应分类器的构建、自适应特征选择、自适应阈值寻优、自适应分类器内部参数调优、自适应最优预测模型的选择等五个方面的内容,取得最好的缺陷预测结果,识别出高风险软件模块。 | ||
搜索关键词: | 一种 基于 软件 网络 缺陷 风险 模块 识别 方法 | ||
【主权项】:
1.一种基于软件网络的缺陷高风险模块识别方法,包括:步骤一,构建自适应分类器,自适应分类器中包含多个分类器;步骤二,自适应特征选择方法,包括:(1)预处理,如果数据集中某项特征的80%以上的实例值都相同,则删掉该特征;(2)对带有惩罚因子的分类器采用递归特征消除算法进行特征的选择;(3)对不带惩罚因子的分类器采用单变量特征选择的卡方检验方法进行特征选择;步骤三,进行自适应阈值寻优;对每个分类器,基于训练集构建预测模型,将验证集输入预测模型得到预测值集合,不断遍历预测值集合中的预测值来更换分类器的阈值,每次根据预测标签集合和真实标签集合计算预测模型的性能指标AUC值,选出使AUC值最高的阈值作为分类器的最佳阈值;步骤四,进行自适应分类器内部参数调优;对于岭回归和套索回归分类器,采用随机搜索方法找到最佳步长,对于K最近邻分类模型采用网格搜索方法选出最佳样本数量k值;步骤五,进行自适应最优预测模型的选择;应用不同的分类器在训练集合上构建缺陷预测模型,计算各缺陷预测模型在多个验证集上的AUC值,取AUC均值最大的缺陷预测模型为最优预测模型,然后利用最优预测模型对待测软件网络进行缺陷高风险模块识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910318037.1/,转载请声明来源钻瓜专利网。