[发明专利]关联图搜索在审
| 申请号: | 202210564603.9 | 申请日: | 2022-05-23 |
| 公开(公告)号: | CN115391604A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | A·奥凯里博 | 申请(专利权)人: | GSI科技公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903;G06K9/62 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关联 搜索 | ||
1.一种关联图搜索系统,包括:
KNN图确定器,其用于提前确定数据集中的每个项目的W个邻居,并且将每个项目和该项目的邻居存储在KNN图中;
在关联处理单元(APU)上实现的降维向量查找器,其用于查找查询向量的第一数量的第一最近邻,所述APU以恒定复杂度操作,而与所述第一数量的大小无关;
结果扩展器,其用于使用所述KNN图针对每个第一最近邻查找W个第二最近邻,从而创建一组邻居;以及
KNN全维向量重排器,其用于从所述一组邻居中查找所述全维查询向量的最终数量的全维最近邻。
2.根据权利要求1所述的关联图搜索系统,所述降维向量查找器使用相似性搜索方法,所述相似性搜索方法是以下各项之一:汉明距离、L1、L2和Tanimoto。
3.根据权利要求1所述的关联图搜索系统,其中,所述关联图搜索系统通过在所述第二最近邻上激活所述结果扩展器来扩展所述一组邻居。
4.一种方法,包括:
接收全维查询向量;
在关联存储器单元(APU)中,减少所述查询向量的大小;
在所述APU中激活第一K个最近邻(KNN)算法以查找所述查询向量的小数量的最近邻,所述KNN算法以恒定复杂度操作,而与所述小数量的大小无关;
通过使用KNN图在主机处理器中将所述小数量扩展到较大数量的最近邻;
在所述主机处理器中获取与所述较大数量的最近邻相关联的全维向量;以及
在所述主机处理器中激活第二K个最近邻(KNN)算法以查找所述查询向量的最终K个全维最近邻。
5.根据权利要求4所述的方法,其中,所述激活第一K个最近邻(KNN)算法包括使用相似性搜索方法,所述相似性搜索方法是以下各项之一:汉明距离、L1、L2和Tanimoto。
6.根据权利要求4所述的方法,其中,在所述较大数量的最近邻上激活所述扩展以进一步扩展最近邻的数量。
7.一种用于查找查询对象的K个最近邻的关联图搜索的方法,所述方法包括:
具有KNN图,所述KNN图包含对象的指向数据库的索引和存储在主机处理器中的所述对象的已知邻居的W个索引;
具有存储在关联存储器单元(APU)中的多个降维向量;
在所述APU中获得所述查询对象的降维查询向量;
在所述APU中执行第一K个最近邻(KNN)算法,来以恒定复杂度查找所述降维查询向量的最近邻对象的第一集合,而与所述第一集合的大小无关;
在所述主机处理器中针对所述最近邻对象中的每一个从所述KNN图中获得附加的已知邻居;
在所述主机处理器中获取所有第一邻居和所述附加的已知邻居的全维向量;以及
在所述主机处理器中执行第二KNN搜索算法,以从所述第一邻居和所述附加的已知邻居之中查找所述查询对象的所述K个最近邻。
8.根据权利要求7所述的方法,其中,所述执行第一K个最近邻(KNN)算法包括使用相似性搜索方法,所述相似性搜索方法是以下各项之一:汉明距离、L1、L2和Tanimoto。
9.根据权利要求7所述的方法,其中,在所述已知邻居上激活所述获得以进一步扩展所述最近邻的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于GSI科技公司,未经GSI科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210564603.9/1.html,转载请声明来源钻瓜专利网。





