[发明专利]数据检索方法、装置及分布式系统在审
申请号: | 202110352820.7 | 申请日: | 2021-03-31 |
公开(公告)号: | CN115146019A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 周思华;向宇;林俊浩 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335;G06F16/951;G06F16/9535;G06F16/9536 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 赵杰 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检索 方法 装置 分布式 系统 | ||
1.一种数据检索方法,包括:
获取针对指定查询范围的目标向量查询请求,所述目标向量查询请求携带了过滤条件,所述指定查询范围具有对应的向量检索索引;
利用所述过滤条件对所述指定查询范围中的数据进行过滤,得到满足过滤条件的记录;
根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询目标向量的第一计算代价;
根据所述第一计算代价,判断是否在所述指定查询范围使用所述向量检索索引查询目标向量;
如果否,采用第二检索方式在所述指定查询范围查询目标向量,所述第二检索方式是与所述向量检索索引不同的检索方式。
2.根据权利要求1所述的方法,所述根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询所述目标向量的第一计算代价,包括:
计算所述指定查询范围中记录的总数量与满足过滤条件的记录的数量的比值,得到过滤比;
利用所述过滤比、需要查找的记录数量、以及基于所述向量检索索引查找单条邻近向量的代价,计算出在所述指定查询范围使用所述向量检索索引查询所述目标向量的第一计算代价。
3.根据权利要求1所述的方法,所述采用第二检索方式在所述指定查询范围查询目标向量,包括:
通过逐条计算满足过滤条件的记录的向量与所述目标向量之间的距离,查询出满足所述目标向量的记录。
4.根据权利要求3所述的方法,所述根据第一计算代价,判断是否使用所述向量检索索引查询目标向量,包括:
计算出满足过滤条件的记录逐条与目标向量计算距离的情况下查询所述目标向量的第二计算代价;
比较所述第一计算代价与第二计算代价的大小;
在所述第一计算代价小于所述第二计算代价的情况下,确定使用所述向量检索索引查询目标向量。
5.根据权利要求4所述的方法,所述计算出满足过滤条件的记录逐条比较向量的情况下查询所述目标向量的第二计算代价,包括:
利用满足过滤条件的记录的数量与每两条向量间计算距离的代价,计算出第二计算代价。
6.根据权利要求1所述的方法,所述指定查询范围包括一个或多个数据文件,每个数据文件具有对应的向量检索索引;
所述根据指定查询范围中记录的总数量与满足过滤条件的记录的数量,确定在所述指定查询范围使用所述向量检索索引查询目标向量的第一计算代价,包括:
分别针对所述指定查询范围中的每个数据文件,根据该数据文件中记录的总数量与该数据文件中满足过滤条件的记录的数量,确定在该数据文件使用其向量检索索引查询目标向量的第一计算代价;
所述根据第一计算代价,判断是否在所述指定查询范围使用所述向量检索索引查询目标向量,包括:
分别针对所述指定查询范围中的每个数据文件,根据该数据文件的第一计算代价,判断是否在该数据文件使用所述向量检索索引查询目标向量。
7.根据权利要求6所述的方法,还包括:
从若干个数据文件中,查找出指定字段相同的多个数据文件;
将所述多个数据文件合并在一个数据文件中;
针对合并后的数据文件,构建对应的向量检索索引。
8.根据权利要求1所述的方法,所述获取针对指定查询范围的目标向量查询请求,包括:
通过搜索范围优化推荐界面获取目标向量查询请求和/或所述目标向量查询请求的查询目标,所述目标向量为所述查询目标的目标向量。
9.根据权利要求1所述的方法,还包括:
确定发送所述目标向量查询请求的用户的用户权限;
判断所述目标向量查询请求所针对的指定查询范围是否在所述用户权限对应的查询范围内;
如果是,允许所述用户查询所述目标向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110352820.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信系统、第一电子设备和第二电子设备
- 下一篇:通信方法及通信装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置