[发明专利]一种基于信息检索的需求追踪恢复方法有效
申请号: | 201911333727.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111124366B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 沈国华;汪海娟;黄志球;陈凯 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F8/10 | 分类号: | G06F8/10;G06F40/194;G06F40/30 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 杨静文 |
地址: | 211106 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 检索 需求 追踪 恢复 方法 | ||
本发明公开了一种基于信息检索的需求追踪恢复方法,属于信息安全技术领域,包括使用IR方法来创建候选链接,然后,对目标制品的附加链接应用一个“bonus”,最后这些目标制品通过语义关系连接起来,解决了传统技术中IR方法不精确的问题,有效提升自动恢复追踪关系的模型性能,在基于信心检索的基础上,增加考虑额外信息,即目标制品间的语义关系,对原始的候选列表进行重排序,将正确追踪链排名上提,减少分析误报。
技术领域
本发明属于大数据技术领域,涉及一种基于信息检索的需求追踪恢复方法。
背景技术
需求追踪(RT),定义为“描述并遵循一个需求的生命周期的能力,无论是向前还是向后(即,从它的起源,通过它的开发和规范,到它随后的部署和使用,并通过在这些阶段中的任何一个持续的需求和迭代阶段)”。可追踪链接恢复(Traceability Links Recovery,TLR)是RT的一个研究方向,它是一项软件工程任务,处理软件制品之间的依赖关系和关系的识别与理解。需求追踪作为软件过程管理中的一个重要环节,在保障系统质量、应对需求变更方面发挥着重要作用。利用需求追踪,软件开发人员可以发现制品之间的依赖关系、评估需求覆盖率及计算需求变更的影响。由于需求追踪一方面致力于帮助软件开发人员进行追踪分析,确定是否所有的低层元素(如设计、源代码)都有与之对应的需求;另一方面,可以用于完整性分析和测试覆盖率评估,以明确是否所有需求都被实现并进行了相应的测试。故而成为需求工程的一个重要研究方向。
随着软件系统的规模的增大和复杂性的日益增长,手动恢复和维护追踪关系费时费力,自然地,一些用于自动恢复和维护追踪关系的技术日益受到关注,其中以基于信息检索技术为主。使用信息检索的优势在于,能够通过文本分析自动恢复追踪关系,对于解决传统需求追踪问题中所面临的人工工作量大、维护困难、容易出错等问题有极大帮助。然而,基于信息检索方法的基本问题是相似性计算(即文本相似度)是基于两种制品间关键字的匹配程度,如果两个制品之间(例如,需求和源代码)是异构的,它们可能不共享一个共同的词汇,同义词,或语言结构,信息检索将会错过追踪这条链。作为需求追踪领域中的一种自动追踪方法,近年来针对基于IR的问题进行了大量的研究。例如,使用诸如利用同义词库、项目术语表、短语、关键短语和重构等策略来减少术语不一致或文本制品中缺少、错位和重复符号所造成的不利影响。然而,不精确仍然是在实践中使用IR进行可追踪链接恢复的主要障碍。
发明内容
本发明的目的是提供一种基于信息检索的需求追踪恢复方法,解决了传统技术中IR方法不精确的问题。
为实现上述目的,本发明采用如下技术方案:
一种基于信息检索的需求追踪恢复方法,包括如下步骤:
步骤1:建立IR模块、域模块、语义关系模块和输出模块,IR模块用于从互联网中获取原始数据;
步骤2:对IR模块获取到的原始数据进行预处理,将其处理为能够支持使用单词嵌入来计算目标制品之间的相似性的预处理数据;
步骤3:利用基于IR的向量空间模型算法VSM,计算源制品和目标制品的相似度值,生成候选追踪链;
步骤4:设定源制品为Ri,域模块为源制品Ri生成一个原始候选列表cl;
在原始候选列表cl中,通过基于IR的可追踪性恢复方法添加源制品Ri的目标制品;
根据目标制品与源制品的相似度值,将目标制品从高到低排序;
步骤5:裁剪排序后的原始候选列表cl中的前k1%的数据,构成需求域,其中k1为正整数;
步骤6:设定目标制品为Tj,语义关系模块通过词嵌入方法,得到相似值从高到低的语义关系列表sl;
步骤7:裁剪语义关系列表sl中的前k2%的数据,构成目标制品语义关系相互依赖图SRTG;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911333727.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置