[发明专利]基于三支决策的半监督变更级软件缺陷预测方法有效
申请号: | 201811145861.3 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109543707B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 李伟湋;黄志球;李金旺;张文舟;贾修一 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/36 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于三支决策的半监督变更级软件缺陷预测方法,包括:对于选择的每个分类器用变更级软件缺陷预测数据集中有标记的样本集合分别进行训练;确定各个分类器在一定审查工作量下对有标记样本的分类误差;利用三支决策方法将无标记的样本集合分别划分至正域、负域以及边界域;分别对正域和负域中的样本进行采样并赋予伪标记作为下一轮中下一个分类器的新的有标记样本集合;在每个分类器对应的新的有标记样本集合上重新训练该分类器;重复训练过程直至所有分类器都不再变化;最后用所有训练好的分类器预测新的变更样本的最终标记和风险值。本发明能够有效降低选入噪声样本的带来的负面影响,提升工作量感知的变更级缺陷预测性能。 | ||
搜索关键词: | 基于 决策 监督 变更 软件 缺陷 预测 方法 | ||
【主权项】:
1.一种基于三支决策的半监督变更级软件缺陷预测方法,其特征在于,包括以下步骤:(1)选择m个分类器,对于每个分类器hi,利用变更级软件缺陷预测数据集中有标记的样本集合L分别进行训练;其中,i表示分类器编号,1≤i≤m,m≥1;(2)确定各个分类器在一定的审查工作量下对有标记训练样本的分类误差
其中,t表示当前训练轮次;(3)根据分类器hi的分类误差
和对各个未知缺陷情况的样本包含缺陷的预测概率p,利用三支决策方法将变更级软件缺陷预测数据集中无标记的样本集合U分别划分至正域、负域以及边界域;(4)分别对分类器hi正域和负域中的样本进行采样并为其赋予伪标记作为下一轮中下一个分类器h(i+1)%m的新的有标记样本集合L(i+1)%m;(5)在每个分类器hi对应的新的有标记样本集合L∪Li上,对每个分类器hi重新进行训练;(6)重复步骤(2)‑步骤(5)直至所有分类器的参数都不再变化;(7)对于新的变更样本,使用所有训练好的分类器预测其最终标记和风险值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811145861.3/,转载请声明来源钻瓜专利网。