[发明专利]基于少样本数据学习的软件缺陷预测方法在审
申请号: | 201910040317.0 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109885482A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 赵林畅;尚赵伟;赵灵;王敏全;周晔 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06K9/66;G06N3/04 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习 软件缺陷 深度特征 样本数据 预测结果 度量 预测 概率输出 函数学习 连接网络 缺陷数据 软件工程 样本学习 正负样本 负样本 数据集 正样本 高维 构建 样本 网络 | ||
本发明涉及一种基于少样本数据学习的软件缺陷预测方法,属于软件工程领域。该方法包括:S1:构建基于孪生网络的SDNN,即孪生全连接网络;S2:输入正样本和负样本数据,通过SDNN网络进行少样本学习,提取样本对数据的高层次深度特征;S3:采用度量学习函数对步骤S2中提取的高层次深度特征进行比较学习和概率输出,调节正负样本比例,设置函数学习参数,使度量学习函数更加关注对有缺陷数据特征的学习;S4:获得预测结果。本发明所采用的方法与现有技术相比,能在有限的、高维的、不平衡的数据集上获得更好的预测效果,而且在不同的不平衡率下,性能更加稳定;还能够在较少数据和时间等条件下,取得更好的预测结果。
技术领域
本发明属于软件工程领域,涉及一种基于少样本数据学习的软件缺陷预测方法。
背景技术
软件缺陷预测是用已有的历史数据来预测软件中是否存在缺陷,它是软件维护中的一项重要任务,直接关系到软件成本和软件质量。目前主要利用机器学习算法对历史数据进行模型构建、训练和评估,而这些历史数据往往是有限的、高维的和类不平衡的,传统的机器学习算法不但需要大量的数据来对所构建的模型进行训练,还很难从高维数据中学得有效的深度表征,特别是在软件测试的早期阶段。
针对有限的软件缺陷数据,LinChen等人(L.Chen,B.Fang,Z.Shang,Y.Tang,Negative samples reduction in cross-company software defects prediction,Information and Software Technology 62(1)(2015)67-77.)提出两阶段迁移学习促进算法从跨公司数据中提取最相似的样本作为训练集,增加训练集样本量,但容易引入新的冗余样本。Yu等人(Q.Yu,S.Jiang,Y.Zhang,A feature matching and transfer approachfor cross-company defect prediction,Journal of Systems and Software 132(2017)366-378.)使用特征匹配算法将异构特征转化为匹配特征,来提高模型AUC值的准确性,但算法复杂度高。Ma等人(Y.Ma,G.Luo,X.Zeng,A.Chen,Transfer learning for cross-company software defect prediction,Inform.Softw.Technol.54(3)(2012)248–256.)从预测应该与分布相关的数据特征出发,提出了基于实例特征转移的贝叶斯迁移学习模型,根据软件缺陷数据特征对训练数据进行重新加权,但该算法需调控的参数较多。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910040317.0/2.html,转载请声明来源钻瓜专利网。