[发明专利]一种基于时态和关键词查询的检索方法和系统在审
申请号: | 201710125163.6 | 申请日: | 2017-03-03 |
公开(公告)号: | CN107066535A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 史红权;陈行军;赵晓哲;张俊 | 申请(专利权)人: | 中国人民解放军海军大连舰艇学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市博太联众专利代理事务所(特殊普通合伙)44354 | 代理人: | 任转英 |
地址: | 116000 *** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时态 关键词 查询 检索 方法 系统 | ||
技术领域
本发明面向信息检索领域,尤其涉及一种基于时态和关键词查询的检索方法和系统。
背景技术
随着大数据时代的到来,信息呈现爆炸式性增长,如何在海量信息中查找有用信息具有 更大的挑战。按照时态属性来组织、存储、管理和检索大数据,已经成为一种有效的解决途 径,因为时态是信息的重要属性维度,任何信息都含有具有相应的时态特性。中国专利申请 CN201610576897.1提供了一种时态图数据中动态属性数据的存储方法和装置,解决了不能实 现对点/边中的动态属性数据单独存储的问题。目前,大多数的搜索引擎对于时态信息缺乏有 效的处理技术,不能很好地理解用户的时态检索意图,检索效果不够理想。
时态信息检索(Temporal Information Retrieval,TIR)通过将时态信息融入信息检索技 术中,可以有效地处理用户的时态查询。按照时间属性快速、高效地检索用户所需要的信息, 并按时间属性分类和排序检索结果,可以在很大程度上提高检索的效率和效果,时态信息检 索已经成为信息检索领域的热点研究方向。
关系数据库中存储的关系数据包含较多的时态属性和时态实体联系信息。近年来,在数 据库领域,基于关键词的关系数据库检索方法研究已经取得大量的研究成果,提出了许多检 索算法,实现了很多原型系统。例如中国专利申请CN201310710834.7提供了一种基于关键词 进行检索的方法及装置,其基于基础关键词的预测权重,虽然从一定程度上提高了检索结果 的准确率和召回率,但是仍然没有充分利用关系数据中丰富的时态信息,还不能有效处理时 态查询。
发明内容
针对现有技术的上述问题,本发明提出一种时态图、一种基于相似度的权重计算方法和 一种基于关键词的关系数据库时态信息检索方法T-STAR方法及相应的系统,T-STAR方法是 从信息的时间维度出发,将时态信息加入到用户的检索过程中,通过对STAR算法的改进, 把关系数据建模成时态数据图,考虑结点之间的内容语义相关性以及时态相关性来计算时态 边的权重,实现了一种基于时态和关键词查询的检索方法,可以满足用户对数据库的时态检 索信息需求。该方法可以有效提高关系数据库信息检索的效果。要识别关键词查询中的显示 或者隐含时态信息,然后根据时态索引检索候选时态实体对象或者是时态联系,执行时态图 搜索算法,生成时态图检索结果,根据相应的过滤和排序机制,将最终结果展现给用户。
本发明提供一种基于时态和关键词查询的检索方法,包括以下步骤:
(1).系统启动阶段,根据关系数据库生成时态数据图,根据时态数据图的结构计算时态边 的权重,得到带权重的时态数据图;
(2).根据用户输入的时态关键词,通过全文索引和时态索引检索出符合用户的时态约束的 候选时态元组集合;
(3).在时态数据图上定位候选元组,得到候选时态结点,然后在时态数据图上执行时态检 索算法,生成时态检索结果;
(4).根据时态排序机制对检索结果排序,输出时态检索结果。
优选的是,时态检索算法具体包括:对每一时态关键词结点分配一个迭代器,寻找一个根 结点,从这个根结点到每个关键词节点的时态路径形成一棵时态Steiner树。
优选的是,采用轮转调度方式,对迭代器中当前关键词结点进行宽度优先搜索,在搜索的 过程中,根据时间的限制进行时态边的过滤,同时,每一条边的权重都需要通过用户输入的 关键词和时间信息进行相似性计算来更新边的权重值。
优选的是,对时态Steiner树进行迭代的优化,用时态最短路径来替换固定结点之间的松 散路径,在时态最短路径的查找过程中找到满足时间限制的边,同时对此边进行动态的权重 计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军海军大连舰艇学院,未经中国人民解放军海军大连舰艇学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710125163.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多源数据聚合方法及系统
- 下一篇:评论确定方法及装置