[发明专利]一种用于查询数据的方法有效
申请号: | 201810167679.1 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108427736B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 毕杰山;钟超强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/22 |
代理公司: | 11329 北京龙双利达知识产权代理有限公司 | 代理人: | 时林;毛威 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 第一数据 内部数据 索引键 一一对应关系 查询数据 关系表示 数据生成 索引信息 索引 主键 分区 方法和装置 查询效率 列数据 有效地 存储 更新 申请 | ||
本申请提供了一种用于查询数据的方法和装置,该方法包括:获取第一数据;根据该第一数据中的L列数据生成P个索引键;根据该P个索引键、该第一数据的行主键和该第一数据的内部数据标识,在该第一数据对应的第一索引分区中更新第一索引信息,该第一数据的内部数据标识在该第一索引分区中是唯一的,该第一索引信息包括针对已存储的M条数据的第一对应关系和第二对应关系,其中,该第一对应关系表示基于该M条数据生成的N个索引键与N组内部数据标识之间的一一对应关系,该第二对应关系表示基于该M条数据生成的M个行主键和该M条数据的M个内部数据标识之间的一一对应关系。因此,可以有效地提供数据的查询效率。
技术领域
本申请涉及存储领域,更具体地,涉及存储领域中一种用于查询数据的方法和装置。
背景技术
在数据查询过程中,可以通过倒排索引实现根据数据的查询过程。其中,倒排索引表示数据实体列表与关键词之间的对应关系,其中,数据实体表示具备该关键词的对象,例如,数据实体可以为用户,数据实体列表即表示具备该关键词的各个数据实体的集合。
在现有技术中,系统为每个数据实体分配对应的整数(Integer,Int)身份标识(Identification,ID),可以通过构建的关键词与多个ID之间的对应关系查找数据。例如,对应关系为:Address:龙岗->{1,2},其中,关键词为:Address:龙岗,多个ID为:1,2,该对应关系表示ID为1和2的承载体具备该关键词。查询数据过程中,可以基于该关键词确定对应的ID,再基于ID确定对应的数据实体。
但是,当底层的数据文件被合并的时候,数据实体与ID之间的对应关系可能会发生变化,这样,导致上述关键词与多个ID之间的对应关系可能已经失效,因此,实际查询数据时,可能需要读取底层数据库中的数据之后,才能查找到满足条件的数据,严重降低了查询效率。尤其当查询条件中包括较多的关键词时,可能会导致查询失败。
发明内容
本申请提供一种用于查询数据的方法,能有效地提高数据的查询效率。
第一方面,提供了一种用于查询数据的方法,所述方法包括:
获取第一数据;
根据所述第一数据中的L列数据生成P个索引键,所述L为大于或等于1的整数,所述P为大于1的整数;
根据所述P个索引键、所述第一数据的行主键和所述第一数据的内部数据标识,在所述第一数据对应的第一索引分区中更新第一索引信息,所述第一数据的行主键用于在数据区中查找所述第一数据,所述第一数据的内部数据标识在所述第一索引分区中是唯一的,所述第一索引信息包括针对已存储的M条数据的第一对应关系和第二对应关系,其中,
所述第一对应关系表示基于所述M条数据生成的N个索引键与N组内部数据标识之间的一一对应关系,每组内部数据标识包括所述M条数据中的至少一条数据的内部数据标识,所述每组内部数据标识是用于标识满足对应的索引键的数据的标识,所述第二对应关系表示基于所述M条数据生成的M个行主键和所述M条数据的M个内部数据标识之间的一一对应关系,所述M和所述N都为大于或等于1的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810167679.1/2.html,转载请声明来源钻瓜专利网。