[发明专利]多个连续top-k关键词查询结果更新方法、系统、存储介质及终端有效

专利信息
申请号: 201710909356.0 申请日: 2017-09-29
公开(公告)号: CN109582698B 公开(公告)日: 2021-08-13
发明(设计)人: 许延伟 申请(专利权)人: 上海宽带技术及应用工程研究中心
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/28;G06F16/22
代理公司: 上海光华专利事务所(普通合伙) 31219 代理人: 徐秋平
地址: 201201 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 连续 top 关键词 查询 结果 更新 方法 系统 存储 介质 终端
【说明书】:

发明提供一种多个连续top‑k关键词查询结果更新方法、系统、存储介质及终端,包括以下步骤:将每个关键词基于关系数据库在先元组查询的备选网络表示为一个以新元组为根节点的网络树;通过自上向下合并近似边的方式将所有的网络树合并为一个以新元组为根节点的根树;自上向下逐层计算所述根树中的连接,并根据连接之间的相似性进行合并查询,以获取多个连续top‑k关键词基于新元组的查询结果。本发明的多个连续top‑k关键词查询结果更新方法、系统、存储介质及终端有效地提高了关系数据库中多个连续top‑k关键词搜索的效率;降低了搜索处理过程中对关系数据库的频繁访问;降低了搜索处理过程中的服务器内存消耗。

技术领域

本发明涉及信息处理的技术领域,特别是涉及一种多个连续top-k关键词查询结果更新方法、系统、存储介质及终端。

背景技术

关系数据库是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。标准数据查询语言SQL就是一种基于关系数据库的语言,这种语言执行对关系数据库中数据的检索和操作。关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。

随着关系数据库中存储的文本数据的增加,简单高效地从数据库中查询文本数据变得越来越重要。但是,传统的结构化查询方法要求用户掌握一定的结构化查询语言和数据库模式的知识,从而极大地限制了其使用范围。随着互联网的发展,越来越多的普通用户需要访问在线数据库,这些用户通常不具备结构化查询语言和数据库模式的知识。随着网络搜索引擎的兴起,关键词查询(Keyword Search)因为其简单方便的特点得到了广泛的使用。因此,在关系型数据库中进行关键词搜索就成为一个很自然的需求。通过在关系数据库中引入关键词搜索,不仅使得更多的用户可以在关系数据库中查询数据,而且使得在互联网上发布数据库内容变得简单易行,因而有着重大的理论意义与现实价值。近年来,关系数据库中的关键词搜索研究获得了广泛的关注,成为数据库领域的研究热点。

关系数据库中关键词搜索的结果是一组元组连接树(Joined Tuple Tree,JTT)。JTT为数据库中包含了关键词的元组根据主外键引用关系连接起来的一个无环、无多重边、无特定根节点的一个无向树。每一个元组连接树(JTT)都是一个关系代数表达式(Relational Algebra Expression)的结果。这种代数表达式被称为备选网络(CandidateNetwork,CN)。图1所示即为一些备选网络的示例。备选网络的生成与关系数据库模式以及关键词在关系表中的实际分布有关,关系数据库中top-k关键词搜索的效率取决于如果快速有效地执行这些生成的备选网络从而找到关联度最大的k的JTT作为搜索结果。

现有关系数据库上的关键词搜索系统主要包括基于数据图(Data Graphbased)的方法和基于模式图(Schema Graph-based)的方法。基于数据图的方法的基本思想是在由数据库中所有元组根据外键引用关系构造的数据图上寻找包含关键词的子图。基于模式图的方法首先根据数据库的模式将关键词查询“翻译”为一系列的关系表的连接(Join)表达式,然后生成结构化查询语句交给关系数据库管理系统去执行生成查询结果。

当数据库被更新以后,如何高效地维护top-k查询结果是一个非常有挑战性的工作。因为数据库更新不仅会导致新的查询结果被生成和已有的查询结果被删除,而且已有查询结果的关联度也会被改变。若数据库被持续更新时需要同时维护多个关键词查询的top-k结果,则面临更大的挑战。

连续top-k关键词搜索的处理过程分为以下两个步骤:

(1)在关键词查询提交到系统时为其计算初始的top-k结果,并保存计算结果后的CN的元组处理状态。

(2)当数据库被改变以后更新top-k查询结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宽带技术及应用工程研究中心,未经上海宽带技术及应用工程研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710909356.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top