[发明专利]云计算环境下基于倒排LSH的高维近似图象检索方法有效
申请号: | 201610083263.2 | 申请日: | 2016-02-05 |
公开(公告)号: | CN105760469B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 季长清;王宝凤;汪祖民;宋佳齐 | 申请(专利权)人: | 大连大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 毕进 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种云计算环境下基于倒排LSH的高维近似图象检索方法,属于基于大数据与移动应用领域。系统建立一种新的索引结构(LSRP‑tree),降低了高维索引代价,提高了查询效率;LSH与MapReduce结合形成的新算法(H‑c2kNN)表现出了良好的扩展性和高效性。这两种创新的应用解决了高维数据空间下的近似检索问题。采用了基于哈希冲突碰撞计数与排序的优化方法,极大地减小中间数据量而加快数据处理速度。本发明是利用智能移动平台来查找图片的系统,包括一组云端服务器和一个移动客户端,后者进行图片采集与传送,前者负责建立高维索引与执行kNN查询处理等。本发明切实有利的提高了大量图像的识别问题,满足人们对移动信息检索智能化的进一步渴求。 | ||
搜索关键词: | 计算 环境 基于 lsh 近似 图象 检索 方法 | ||
【主权项】:
1.一种云计算环境下基于倒排LSH的高维近似图象检索方法,其特征在于,包括步骤:移动客户端通过摄像头采集并提取图片特征,与云中心服务系统通信;云中心服务系统建立基于倒排位置敏感哈希索引并查询得到与采集图片对应的近邻图像;所述查询是建立基于位置敏感哈希分布式倒排索引的kNN查询,步骤是:设定网格单元大小为ɡ*ɡ,给定一个查询点q,用Aq表示q点所在网格,以r为半径,q为圆心作圆,对于特定的哈希函数,给定一点q,求其相邻点时,首先利用函数分成若干个Hash桶,将Hash桶作为Key,Hash桶内的点集作为Value,Hash桶代指特定关系存在区域,用hv1、hv2、hv3······hvN表示,然后函数利用数据与哈希函数之间的关系对应哈希到特定的桶内,同时会使q与其有对应关系的桶内数据进行碰撞,筛选出与q碰撞次数较高的数据进行整合,则就得到某一特定点的相似数据;对于图片的索引,需要更多的特征才能确定某一具体图片,需要求出其他特征的相似数据,给定另一点P,同样建立在同一数据表格中,以R为半径,p为圆心,找出其近邻数据点,p与q点的最近邻中可能出现同一点M,则M为索引的特征数据点的概率就特别大,以此类推,进行哈希,直至找出最终数据;筛选出与q碰撞次数较高的数据的方法如下:设高维数据集合为S,S是图象检索系统中已有大规模图象库,查询对象集合为Q,Q是查询图象对象,先进行高维特征提取后,形成特征集,对于每个查询对象q属于Q,初始化关联函数h,h属于G,G是一个哈希族,LSH是一个多轮哈希的算法,不同的哈希函数,会得到不同的哈希结果,h对应q的相似点集合,半径集合R=getCandidates(hashvalue),hashvalue是哈希值,不同的哈希值,得到不同的哈希结果,R是桶宽;在某一半径为r的区域内进行有关哈希函数的哈希冲突碰撞,哈希的每个对象为hashvalue=Computer(q,h),每一个hasvalue是通过哈希计算函数得到的,多次碰撞直至将数据全部哈希,筛选出碰撞次数相对比较高的对象d=computer(q,c),对象d为对象q的临近点的概率最高,对象d是碰撞可能性最高的对象,用碰撞计数统计代替实际的值,统计碰撞的次数作为最后的排序结果,减小中间数据量,从加快MapReduce的处理速度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610083263.2/,转载请声明来源钻瓜专利网。