[发明专利]数据检索方法、装置及分布式系统在审
申请号: | 202110352820.7 | 申请日: | 2021-03-31 |
公开(公告)号: | CN115146019A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 周思华;向宇;林俊浩 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335;G06F16/951;G06F16/9535;G06F16/9536 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 赵杰 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检索 方法 装置 分布式 系统 | ||
本说明书实施例提供数据检索方法、装置及分布式系统,其中所述数据检索方法包括:获取针对指定查询范围的目标向量查询请求,所述目标向量查询请求携带了过滤条件,所述指定查询范围具有对应的向量检索索引;利用所述过滤条件对所述指定查询范围中的数据进行过滤,得到满足过滤条件的记录;根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询目标向量的第一计算代价;根据所述第一计算代价,判断是否在所述指定查询范围使用所述向量检索索引查询目标向量;如果否,采用第二检索方式在所述指定查询范围查询目标向量。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种数据检索方法。本说明书一个或者多个实施例同时涉及一种数据检索装置,一种分布式系统、一种计算设备,以及一种计算机可读存储介质。
背景技术
由于数据检索应用场景灵活多变,数据量大,对于需要基于向量进行搜索的场景来说,通常采用向量检索索引来提高搜索效率。向量检索索引,是基于一些向量索引算法的检索引擎,一般有两个基本参数,一个是n,表示用n条向量去做检索。另一个是k,表示查找离目标向量最近的前k个向量,一般称为top-k。
但是,在实际应用中,向量检索索引有时检索性能是比较低的,并不能提高检索效率。
发明内容
有鉴于此,本说明书实施例提供了一种数据检索方法。本说明书一个或者多个实施例同时涉及一种数据检索装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种数据检索方法,包括:获取针对指定查询范围的目标向量查询请求,所述目标向量查询请求携带了过滤条件,所述指定查询范围具有对应的向量检索索引;利用所述过滤条件对所述指定查询范围中的数据进行过滤,得到满足过滤条件的记录;根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询目标向量的第一计算代价;根据所述第一计算代价,判断是否在所述指定查询范围使用所述向量检索索引查询目标向量;如果否,采用第二检索方式在所述指定查询范围查询目标向量,所述第二检索方式是与所述向量检索索引不同的检索方式。
可选地,所述根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询所述目标向量的第一计算代价,包括:计算所述指定查询范围中记录的总数量与满足过滤条件的记录的数量的比值,得到过滤比;利用所述过滤比、需要查找的记录数量、以及基于所述向量检索索引查找单条邻近向量的代价,计算出在所述指定查询范围使用所述向量检索索引查询所述目标向量的第一计算代价。
可选地,所述采用第二检索方式在所述指定查询范围查询目标向量,包括:通过逐条计算满足过滤条件的记录的向量与所述目标向量之间的距离,查询出满足所述目标向量的记录。
可选地,所述根据第一计算代价,判断是否使用所述向量检索索引查询目标向量,包括:计算出满足过滤条件的记录逐条与目标向量计算距离的情况下查询所述目标向量的第二计算代价;比较所述第一计算代价与第二计算代价的大小;在所述第一计算代价小于所述第二计算代价的情况下,确定使用所述向量检索索引查询目标向量。
可选地,所述计算出满足过滤条件的记录逐条比较向量的情况下查询所述目标向量的第二计算代价,包括:利用满足过滤条件的记录的数量与每两条向量间计算距离的代价,计算出第二计算代价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110352820.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信系统、第一电子设备和第二电子设备
- 下一篇:通信方法及通信装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置