[发明专利]一种基于信息检索的需求追踪恢复方法有效
申请号: | 201911333727.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111124366B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 沈国华;汪海娟;黄志球;陈凯 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F8/10 | 分类号: | G06F8/10;G06F40/194;G06F40/30 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 杨静文 |
地址: | 211106 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 检索 需求 追踪 恢复 方法 | ||
1.一种基于信息检索的需求追踪恢复方法,其特征在于:包括如下步骤:
步骤1:建立IR模块、域模块、语义关系模块和输出模块,IR模块用于从互联网中获取原始数据;
步骤2:对IR模块获取到的原始数据进行预处理,将其处理为能够支持使用单词嵌入来计算目标制品之间的相似性的预处理数据;
步骤3:利用基于IR的向量空间模型算法VSM,计算源制品和目标制品的相似度值,生成候选追踪链;
步骤4:设定源制品为Ri,域模块为源制品Ri生成一个原始候选列表cl;
在原始候选列表cl中,通过基于IR的可追踪性恢复方法添加源制品Ri的目标制品;
根据目标制品与源制品的相似度值,将目标制品从高到低排序;
步骤5:裁剪排序后的原始候选列表cl中的前k1%的数据,构成需求域,其中k1为正整数;
步骤6:设定目标制品为Tj,语义关系模块通过词嵌入方法,得到相似值从高到低的语义关系列表sl;
步骤7:裁剪语义关系列表sl中的前k2%的数据,构成目标制品语义关系相互依赖图SRTG;
步骤8:对于源制品Ri,需求域内部的目标制品Tj被直接添加到一个候选列表中;
对于需求域外部的目标制品Tj,判断其是否在目标制品语义关系相互依赖图SRTG中:是,则增加一个“bonus”值进行重新排序,生成一个新的候选列表;否,则舍弃;
步骤9:根据步骤8中生成的新的候选列表,对需求域外部的目标制品进行重新排序;
步骤10:所述新的候选列表即为对原始候选列表的重新排序,输出模块输出所述新的候选列表。
2.如权利要求1所述的一种基于信息检索的需求追踪恢复方法,其特征在于:所述IR模块、域模块、语义关系模块和输出模块均部署在分布式服务器集群中。
3.如权利要求1所述的一种基于信息检索的需求追踪恢复方法,其特征在于:在执行步骤6到步骤8时,设定G(T,E)表示目标制品Tj间的关系图,其中T={t1,…tn}为目标制品集合,E={ti,tj}用边来表示ti与tj之间有关系;
设定S={s1,…,sn}表示源制品的集合,设定List={s,t}为使用IR方法计算出的候选链接列表,其中sS,tT;
在目标制品语义关系相互依赖图SRTG中,如果目标制品Tj和源制品之间有链接,在语义上与目标制品Tj最相似的目标制品将被给予额外的“bonus”,即与源制品之间的相似值将被重新计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911333727.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置