[发明专利]适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法在审
申请号: | 202110281981.1 | 申请日: | 2021-03-16 |
公开(公告)号: | CN112905478A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 陈翔;葛骅;陈晓红;贾焱鑫;林浩 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/35;G06F40/284;G06F40/211 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 沈海霞 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 海量 均衡 缺陷 报告 软件 严重 程度 预测 方法 | ||
1.一种适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法,其特征在于,所述预测方法包括以下步骤:
步骤1.构建缺陷报告数据集DBR:
从项目所托管的软件缺陷跟踪系统中搜集历史缺陷报告,针对每一份缺陷报告抽取所述缺陷报告中描述信息summary和严重程度severity两个属性的信息,构建缺陷报告数据集DBR;
步骤2.构建缺陷报告样本集:
对所述缺陷报告数据集DBR的严重程度severity进行预处理得到新缺陷报告数据集D′BR,利用训练好的bert模型处理新缺陷报告数据集D′BR中描述信息summary得到句子向量集,利用句子向量集和严重程度severity构建缺陷报告样本集,所述构建缺陷报告样本集中的单个样本由句子向量和严重程度severity组成;
步骤3.利用borderline-smote算法实现建缺陷报告样本集中的样本均衡;
步骤4.利用均衡后的缺陷报告样本集训练逻辑回归模型得到缺陷报告严重程度预测模型;
步骤5.利用缺陷报告严重程度预测模型对新缺陷报告进行预测:
利用步骤2中训练好的Bert模型,得到新缺陷报告对应的句子向量,然后输入步骤4所构建的缺陷报告严重程度预测模型,得到新缺陷报告所对应的严重程度。
2.根据权利要求1所述的海量不均衡缺陷报告的软件缺陷严重程度预测方法,其特征在于,所述步骤2包含以下步骤:
步骤21:仅保留缺陷报告数据集DBR中严重程度severity取值为Blocker、Critical、Major、Minor、Trivial的缺陷报告,忽略严重程度severity取值为Normal、Enhancement的缺陷报告,从而形成新缺陷报告数据集D′BR;
步骤22:对新缺陷报告数据集D′BR中严重程度severity取值重新定义类别,即将严重程度severity取值为Blocker、Critical、Major这三种类别合并为类别1,将严重程度severity取值为Minor、Trivial这两种类别合并为类别0;
步骤23:利用训练好的bert模型处理新缺陷报告数据集D′BR中的描述信息summary得到句子向量集,利用句子向量集和严重程度构建缺陷报告样本集,所述构建缺陷报告样本集中的单个样本由句子向量和严重程度组成;其中,在将新缺陷报告数据集D′BR中的描述信息summary输入到bert模型之前,对描述信息summary进行文本预处理形成分词向量,所述文本预处理包括对所述描述信息summary进行分词,还原词根,去除特殊符号,过滤停用词。
3.根据权利要求2所述的海量不均衡缺陷报告的软件缺陷严重程度预测方法,其特征在于,所述步骤3包含以下步骤:
步骤31:根据严重程度severity获得缺陷报告样本集中的较少类样本,将较少类样本分为3类,分别为Safe、Danger和Noise类;其中,Safe类是指样本周围一半以上均为较少类样本,Danger类是指样本周围一半以上均为较多类样本,Noise类是指样本周围均为较多类样本;
步骤32:分别对上述3类样本进行处理,具体步骤如下:
步骤321:针对所述少数类样本中的每一个Safe类样本xi及每一个Noise类样本xi,不进行任何操作;
步骤322:针对所述少数类样本中的每一个Danger类样本xi,按采样倍率N(1≤N≤K)从xi的K近邻中随机选择N个样本{xyi|1≤y≤N},在xyi和xi之间随机合成新样本xn,直至较少样本的数量和较多样本的数量相等,从而得到均衡后的缺陷报告样本集,所述新样本xn合成公式如下:
xn=xi+β×(xyi-xi);
其中,β为0-1之间的随机数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110281981.1/1.html,转载请声明来源钻瓜专利网。