[发明专利]一种跨项目软件老化缺陷预测方法有效

专利信息
申请号: 202010758279.5 申请日: 2020-07-31
公开(公告)号: CN111881048B 公开(公告)日: 2022-06-03
发明(设计)人: 向剑文;徐斌;贾凯;赵冬冬 申请(专利权)人: 武汉理工大学
主分类号: G06F11/36 分类号: G06F11/36;G06K9/62;G06N20/00
代理公司: 湖北武汉永嘉专利代理有限公司 42102 代理人: 张惠玲
地址: 430070 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 项目 软件 老化 缺陷 预测 方法
【说明书】:

发明公开了一种跨项目软件老化预测方法,首先对源项目和目标项目中的数据进行预处理,之后采用联合分布域适应减小边缘分布和条件分布差异,然后采用欠采样法和改进的子类判别分析法缓解类不平衡问题,最后使用机器学习分类器(逻辑回归等)进行预测。本发明考虑了软件老化缺陷数据集源项目和目标项目间的条件分布差异,并进一步采用改进的子类判别分析法等缓解极其严重的类不平衡问题。它解决了传统跨项目软件老化缺陷预测方法精度以及健壮性不高的问题,有助于开发者在开发测试阶段发现软件老化相关缺陷并移除,避免软件老化问题带来的损失。本发明已在真实软件上验证过其可行性,并可推广至其他软件来预测软件老化相关缺陷。

技术领域

本发明属于软件处理技术领域,具体涉及一种跨项目软件老化缺陷预测方法。

背景技术

在长期运行的操作系统中,软件老化是造成系统性能下降或软件崩溃的主要原因。其由软件老化相关缺陷(Aging-Related Bugs,ARB)引起,如内存泄漏,未释放的文件锁,存储问题等。且其已被发现存在于多种系统中,如Android、Linux、Windows等。软件老化的复杂性和时间特性导致其检测十分困难。故在开发测试阶段(代码层次)预测并移除软件老化相关缺陷是降低软件老化所带来损失的重要方式之一。

近年来,老化缺陷预测逐步受到可靠性领域学者的重视。部分学者通过使用代码静态特征(如代码行数,注释数等)并利用机器学习等方法来训练模型进行项目内老化缺陷预测,然而由于老化缺陷占比较少,如Linux老化缺陷数据集中老化缺陷仅占比0.59%,对我们来说在项目内收集到足够的训练数据进行建模是非常困难的。

针对训练数据不充足这个问题,部分学者提出了跨项目软件老化缺陷预测。通过利用其它项目的相关数据来进行目标项目模型的训练。其中,近期提出的主要方法是通过迁移学习来减少分布差异,并进一步处理类不平衡问题来进行跨项目老化缺陷预测。然而,传统的方法中仅考虑了边缘分布的差异,未考虑条件分布的差异性,降低了迁移效果。且仅用过采样法处理类不平衡问题,极易导致过拟合,对不同的机器学习分类器不够健壮,即预测效果差异较大。

发明内容:

为了克服上述背景技术的缺陷,本发明提供一种跨项目软件老化缺陷预测方法。

为了解决上述技术问题本发明的所采用的技术方案为:

一种跨项目软件老化缺陷预测方法,包括:

步骤1,对源项目和目标项目数据进行预处理,生成第一数据;

步骤2,对第一数据采用联合分布域适应方法(JDA)来减小分布差异,生成第二数据;

步骤3,对所述第二数据采用改进的子类判别分析(ISDA)和欠采样法(RUS)进行类不平衡问题处理,同时进行分类特征学习,生成第三数据;

步骤4,针对所述第三数据,采用机器学习方法训练预测模型并在目标项目上进行老化缺陷预测。

其中,在对源项目和目标项目数据进行预处理的步骤中,采用z-score数据标准化方法,将源项目和目标项目数据中每一个样本的特征值减去训练集特征的均值后除以训练集特征度量的方差,得到第一数据。

其中,对第一数据采用联合分布域适应方法来减小分布差异的步骤中,采用联合分布域适应方法同时减小第一数据边缘分布和条件分布的差异。

其中,在对所述第二数据采用改进的子类判别分析(ISDA)和欠采样法(RUS)进行类不平衡问题处理的步骤中,针对第二数据,首先采用改进的子类判别分析法对数据集进行处理,即将第二数据的数据集分别映射至子类空间中,采用k-means聚类方法进行映射,以寻找使得子类间距离最大化和类内距离最小化的映射向量V,来学习具有更强分类能力的特征;然后,对源数据集采用欠采样法进一步缓解类不平衡问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010758279.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top