[发明专利]一种基于质量过滤器的缺陷报告标题自动生成方法在审
申请号: | 202210379210.0 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114676298A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 林浩;陈翔;陈雪娇;苏展;缪芸;杨光;刘珂;周彦琳;于池 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/951;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 质量 过滤器 缺陷 报告 标题 自动 生成 方法 | ||
本发明提供了一种基于质量过滤器的缺陷报告标题自动生成方法,属于软件质量保障技术领域。其技术方案为:首先从GitHub上选择高质量开源项目,再对数据集进行数据预处理,训练自动生成模型,当预测新的缺陷报告时,分别基于通过学习低质量缺陷报告特征进行过滤的深度学习模块和通过判断历史数据集中是否存在与新缺陷报告内容相似的数据实现预测的信息检索模块,来协同预测该缺陷报告能否生成高质量标题,若预测能,则通过自动生成模型生成标题,反之则提出警告。本发明的有益效果为:通过使用正则表达式进行数据预处理,提高了数据处理效率和方法的兼容性;通过双模块协同过滤,提高了自动生成模型生成的标题质量与效率。
技术领域
本发明涉及软件质量保障技术领域,尤其是一种基于质量过滤器的缺陷报告标题自动生成方法。
背景技术
在现代软件工程的开发过程中,软件缺陷修复一直作为一个重要问题伴随在软件更新迭代和技术快速发展的左右。软件缺陷报告是一种特定的报告,其中包含故障描述信息、堆栈跟踪和其他诊断信息,以帮助开发人员定位和修复软件项目中的错误。在软件项目开发和维护过程中,软件缺陷报告管理十分重要,与软件缺陷修复的效率密切相关。目前,软件缺陷报告分析已经引起了研究人员的广泛关注。
根据专业QA平台Testlio的建议,高质量的软件缺陷报告标题应该为软件缺陷报告主体提供简洁、准确的摘要,使开发者不需要阅读软件缺陷报告正文的详细信息,就可以快速了解软件缺陷报告的核心内容。然而,由于开发者缺乏经验等原因,开源项目的软件缺陷报告标题质量远远不能令人满意。在为缺陷报告命名时,以开发人员手动命名为代表的传统命名方式具有受个人主观因素影响大、不清晰、不准确的缺点,因此,寻找自动化替代方案是大势所趋。为了帮助开发人员生成高质量的软件缺陷报告标题,已经存在一些探索,从而将软件缺陷报告标题生成问题转化为单句摘要问题。此外,为了缓解发行主体中的标识符和版本号引起的低词频问题,一些研究人员提出可以采用令牌标记法等。这在一定程度上提高了方法的效果。
然而,在分析了现有方法生成的软件缺陷报告标题的BLEU分数分布后,发现平均只有19.6%的生成标题的BLEU分数可以超过0.1,现有方法生成的很大一部分标题是低质量的,这可能会误导开发者,使开发者仍旧需要花费许多时间和精力阅读软件缺陷报告,以了解软件缺陷报告内容并确认这些标题的正确性,最终降低开发者对自动化替代方法的信心。为了提高生成标题的质量,一种可能的解决方案是提高现有方法的性能(例如提高数据集的质量或设计新的软件缺陷报告标题生成方法)。目标是从另一个角度解决这个问题,在此基础上提出了一种基于质量预测的过滤器,以使自动化替代方法更实用、更值得信赖。
发明内容
为了解决上述技术问题,本发明提供了一种基于质量过滤器的缺陷报告标题自动生成方法,通过提出两个质量检测模块,并将其有机结合,从而快速且高可靠性地过滤低质量的软件缺陷报告标题自动化生成结果。
为了实现上述发明目的,本发明采用的技术方案具体为:
一种基于质量过滤器的缺陷报告标题自动生成方法,其特征在于,包括如下步骤:
(1)从GitHub上选择高质量开源项目,通过爬虫技术搜集开源项目内的缺陷报告内容和标题以构建数据集D,随后按照80%:20%的比例依次构造训练集Dtrain和验证集Dval;
(2)对训练集Dtrain和验证集Dval进行数据预处理,以提升数据集质量;
(3)基于训练集Dtrain和验证集Dval,使用基于注意力机制的seq2seq深度学习模型构建标题自动生成模型MGen;
(4)构建基于双模块的质量过滤器,两个模块分别基于信息检索方法和深度学习方法构建,实现协同过滤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210379210.0/2.html,转载请声明来源钻瓜专利网。