[发明专利]一种文本代码相结合的缺陷原因自动分类方法有效
申请号: | 201811346186.0 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109492106B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 周澄;李斌;孙小兵;陈定山 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 马鲁晋 |
地址: | 226009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本代码相结合的缺陷原因自动分类方法,包括以下步骤:首先提取缺陷报告中的文本内容及附录中的patch文件,之后进行数据清洗形成缺陷数据集;选取状态为VERIFIED FIXED且附有patch文件的缺陷,构建待分类缺陷集;抽取待分类缺陷集中缺陷的文本内容并进行自然语言处理,之后对其进行类别标注,构建缺陷原因分类集;从patch文件中抽取缺陷修复前、后的diff代码,获取缺陷修复中修改的diff代码对应的缺陷修改结构类别;利用深度学习方法对缺陷原因分类集进行训练,获取缺陷原因自动分类器。本发明通过深度学习模型挖掘缺陷报告的语义信息和diff结构特征,能准确预测缺陷的原因类别,明确发生缺陷的可疑代码结构,从而更准确的引导后续的缺陷定位和缺陷修复。 | ||
搜索关键词: | 一种 文本 代码 相结合 缺陷 原因 自动 分类 方法 | ||
【主权项】:
1.一种文本代码相结合的缺陷原因自动分类方法,其特征在于,包括以下步骤:步骤1、提取缺陷报告中的文本内容以及附录中的patch文件,之后进行数据清洗形成缺陷数据集;步骤2、从所述缺陷数据集中选取状态为VERIFIED FIXED且附有patch文件的缺陷,构建待分类缺陷集;步骤3、抽取待分类缺陷集中缺陷的文本内容,并对其进行自然语言处理,之后根据缺陷原因分类标准对待分类缺陷集进行类别标注,构建缺陷原因分类集;步骤4、自定义缺陷修改结构类别,并从所述patch文件中抽取缺陷修复前、后的diff代码,之后获取缺陷修复过程中修改的diff代码对应的缺陷修改结构类别;步骤5、利用深度学习方法对缺陷原因分类集进行训练,获取缺陷原因自动分类器,新缺陷输入缺陷原因自动分类器即可完成缺陷原因的自动分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811346186.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多特征集成学习的文本情感分类方法
- 下一篇:一种导诊的方法及装置