[发明专利]基于少样本数据学习的软件缺陷预测方法在审

申请号：	201910040317.0	申请日：	2019-01-16
公开（公告）号：	CN109885482A	公开（公告）日：	2019-06-14
发明（设计）人：	赵林畅;尚赵伟;赵灵;王敏全;周晔	申请（专利权）人：	重庆大学
主分类号：	G06F11/36	分类号：	G06F11/36;G06K9/62;G06K9/66;G06N3/04
代理公司：	北京同恒源知识产权代理有限公司 11275	代理人：	赵荣之
地址：	400044 重***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	学习软件缺陷深度特征样本数据预测结果度量预测概率输出函数学习连接网络缺陷数据软件工程样本学习正负样本负样本数据集正样本高维构建样本网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于少样本数据学习的软件缺陷预测方法，属于软件工程领域。该方法包括：S1：构建基于孪生网络的SDNN，即孪生全连接网络；S2：输入正样本和负样本数据，通过SDNN网络进行少样本学习，提取样本对数据的高层次深度特征；S3：采用度量学习函数对步骤S2中提取的高层次深度特征进行比较学习和概率输出，调节正负样本比例，设置函数学习参数，使度量学习函数更加关注对有缺陷数据特征的学习；S4：获得预测结果。本发明所采用的方法与现有技术相比，能在有限的、高维的、不平衡的数据集上获得更好的预测效果，而且在不同的不平衡率下，性能更加稳定；还能够在较少数据和时间等条件下，取得更好的预测结果。

技术领域

本发明属于软件工程领域，涉及一种基于少样本数据学习的软件缺陷预测方法。

背景技术

软件缺陷预测是用已有的历史数据来预测软件中是否存在缺陷，它是软件维护中的一项重要任务，直接关系到软件成本和软件质量。目前主要利用机器学习算法对历史数据进行模型构建、训练和评估，而这些历史数据往往是有限的、高维的和类不平衡的，传统的机器学习算法不但需要大量的数据来对所构建的模型进行训练，还很难从高维数据中学得有效的深度表征，特别是在软件测试的早期阶段。

针对有限的软件缺陷数据，LinChen等人(L.Chen,B.Fang,Z.Shang,Y.Tang,Negative samples reduction in cross-company software defects prediction,Information and Software Technology 62(1)(2015)67-77.)提出两阶段迁移学习促进算法从跨公司数据中提取最相似的样本作为训练集，增加训练集样本量，但容易引入新的冗余样本。Yu等人(Q.Yu,S.Jiang,Y.Zhang,A feature matching and transfer approachfor cross-company defect prediction,Journal of Systems and Software 132(2017)366-378.)使用特征匹配算法将异构特征转化为匹配特征，来提高模型AUC值的准确性，但算法复杂度高。Ma等人(Y.Ma,G.Luo,X.Zeng,A.Chen,Transfer learning for cross-company software defect prediction,Inform.Softw.Technol.54(3)(2012)248–256.)从预测应该与分布相关的数据特征出发，提出了基于实例特征转移的贝叶斯迁移学习模型，根据软件缺陷数据特征对训练数据进行重新加权，但该算法需调控的参数较多。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆大学，未经重庆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910040317.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F11-00 错误检测；错误校正；监控
G06F11-07 .响应错误的产生，例如，容错
G06F11-22 .在准备运算或者在空闲时间期间内，通过测试作故障硬件的检测或定位
G06F11-28 .借助于检验标准程序或通过处理作错误检测、错误校正或监控
G06F11-30 .监控
G06F11-36 .通过软件的测试或调试防止错误

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于少样本数据学习的软件缺陷预测方法在审

专利文献下载