[发明专利]一种基于信息检索的需求追踪恢复方法有效

专利信息
申请号: 201911333727.0 申请日: 2019-12-23
公开(公告)号: CN111124366B 公开(公告)日: 2021-11-16
发明(设计)人: 沈国华;汪海娟;黄志球;陈凯 申请(专利权)人: 南京航空航天大学
主分类号: G06F8/10 分类号: G06F8/10;G06F40/194;G06F40/30
代理公司: 常州佰业腾飞专利代理事务所(普通合伙) 32231 代理人: 杨静文
地址: 211106 江苏省南京市江宁区*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 检索 需求 追踪 恢复 方法
【说明书】:

发明公开了一种基于信息检索的需求追踪恢复方法,属于信息安全技术领域,包括使用IR方法来创建候选链接,然后,对目标制品的附加链接应用一个“bonus”,最后这些目标制品通过语义关系连接起来,解决了传统技术中IR方法不精确的问题,有效提升自动恢复追踪关系的模型性能,在基于信心检索的基础上,增加考虑额外信息,即目标制品间的语义关系,对原始的候选列表进行重排序,将正确追踪链排名上提,减少分析误报。

技术领域

本发明属于大数据技术领域,涉及一种基于信息检索的需求追踪恢复方法。

背景技术

需求追踪(RT),定义为“描述并遵循一个需求的生命周期的能力,无论是向前还是向后(即,从它的起源,通过它的开发和规范,到它随后的部署和使用,并通过在这些阶段中的任何一个持续的需求和迭代阶段)”。可追踪链接恢复(Traceability Links Recovery,TLR)是RT的一个研究方向,它是一项软件工程任务,处理软件制品之间的依赖关系和关系的识别与理解。需求追踪作为软件过程管理中的一个重要环节,在保障系统质量、应对需求变更方面发挥着重要作用。利用需求追踪,软件开发人员可以发现制品之间的依赖关系、评估需求覆盖率及计算需求变更的影响。由于需求追踪一方面致力于帮助软件开发人员进行追踪分析,确定是否所有的低层元素(如设计、源代码)都有与之对应的需求;另一方面,可以用于完整性分析和测试覆盖率评估,以明确是否所有需求都被实现并进行了相应的测试。故而成为需求工程的一个重要研究方向。

随着软件系统的规模的增大和复杂性的日益增长,手动恢复和维护追踪关系费时费力,自然地,一些用于自动恢复和维护追踪关系的技术日益受到关注,其中以基于信息检索技术为主。使用信息检索的优势在于,能够通过文本分析自动恢复追踪关系,对于解决传统需求追踪问题中所面临的人工工作量大、维护困难、容易出错等问题有极大帮助。然而,基于信息检索方法的基本问题是相似性计算(即文本相似度)是基于两种制品间关键字的匹配程度,如果两个制品之间(例如,需求和源代码)是异构的,它们可能不共享一个共同的词汇,同义词,或语言结构,信息检索将会错过追踪这条链。作为需求追踪领域中的一种自动追踪方法,近年来针对基于IR的问题进行了大量的研究。例如,使用诸如利用同义词库、项目术语表、短语、关键短语和重构等策略来减少术语不一致或文本制品中缺少、错位和重复符号所造成的不利影响。然而,不精确仍然是在实践中使用IR进行可追踪链接恢复的主要障碍。

发明内容

本发明的目的是提供一种基于信息检索的需求追踪恢复方法,解决了传统技术中IR方法不精确的问题。

为实现上述目的,本发明采用如下技术方案:

一种基于信息检索的需求追踪恢复方法,包括如下步骤:

步骤1:建立IR模块、域模块、语义关系模块和输出模块,IR模块用于从互联网中获取原始数据;

步骤2:对IR模块获取到的原始数据进行预处理,将其处理为能够支持使用单词嵌入来计算目标制品之间的相似性的预处理数据;

步骤3:利用基于IR的向量空间模型算法VSM,计算源制品和目标制品的相似度值,生成候选追踪链;

步骤4:设定源制品为Ri,域模块为源制品Ri生成一个原始候选列表cl;

在原始候选列表cl中,通过基于IR的可追踪性恢复方法添加源制品Ri的目标制品;

根据目标制品与源制品的相似度值,将目标制品从高到低排序;

步骤5:裁剪排序后的原始候选列表cl中的前k1%的数据,构成需求域,其中k1为正整数;

步骤6:设定目标制品为Tj,语义关系模块通过词嵌入方法,得到相似值从高到低的语义关系列表sl;

步骤7:裁剪语义关系列表sl中的前k2%的数据,构成目标制品语义关系相互依赖图SRTG;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911333727.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top