[发明专利]基于分层结构的局部敏感哈希图像索引方法有效
申请号: | 201910033703.7 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109829066B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 吴家皋;黄超;侯泽磊;成新宇 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 结构 局部 敏感 希图 索引 方法 | ||
本发明揭示了一种基于分层结构的局部敏感哈希图像索引方法,包括如下步骤:S1、定义局部敏感哈希函数族
技术领域
本发明涉及一种图像索引方法,具体而言,涉及一种基于分层结构的局部敏感哈希图像索引方法,属于图像处理技术领域。
背景技术
随着云计算、大数据技术的发展,互联网上的图像、视频等多媒体数据的处理量急剧增长。与传统数据相比,图像、视频等多媒体数据具有高维度、非结构化的特性,这也就对相似性数据检索和语义分析等算法的研究提出了新的挑战。基于图像特征的局部敏感哈希(Local ity Sensitive Hash,LSH)算法在处理高维数据时表现出了良好的性能,也正基于此,使其成为了近年来的研究热点。
LSH算法由Indyk和Motwani于1998年提出,其基本思想是对数据点集利用一组哈希函数,使得经过哈希映射后相似的点冲突的概率增大,而不相似的点冲突的概率减小。目前,领域内已提出多个与局部敏感哈希相关的哈希索引方法,例如:p稳定局部敏感哈希将空间距离计算由汉明空间转移到欧式空间;基于熵的局部敏感哈希在查询项的周围随机产生扰动对象作为查询项集合;多探针局部敏感哈希根据候选查询结果与查询对象的相邻关系提出了有效的索引方案。
由于局部敏感哈希函数的随机性,单个局部敏感哈希函数往往不能满足相似性检索的要求。为了提高算法的精确率,使用k个局部敏感哈希函数组成k维局部敏感哈希函数族;为了提高算法的召回率,使用L个k维局部敏感哈希函数来创建L张哈希表;这样的操作方式也逐渐成为了业内在使用局部敏感哈希处理时的常见步骤。但在实际应用过程中操作人员发现,尽管在局部敏感哈希处理中引入了参数L、k,但还是存在部分特征向量数据在哈希划分时出现错误的情况。
综上所述,如何在现有技术的基础上,提出一种新的局部敏感哈希算法,从而克服现有技术中存在的问题、提高算法使用过程中的检索效率,也就成为了目前业内研究人员亟待解决的问题。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种基于分层结构的局部敏感哈希图像索引方法,包括如下步骤:
S1、定义局部敏感哈希函数族H;
S2、从H中取出k个函数,定义k维局部敏感哈希函数族G;
S3、利用G将图像特征数据集映射为k维向量集;
S4、采用求和取余哈希法建立L张哈希表;
S5、判断是否已进行过第二次局部敏感哈希处理,若否则重新设置k和L,并返回S2,若是则结束流程。
优选地,S1具体包括如下步骤:
设任一图像都能表示为d维特征向量空间Rd中的一个点,则所有图像构成d维特征向量数据集D,定义局部敏感哈希函数族H={h|D→U}为从数据集D到整数域U的映射,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910033703.7/2.html,转载请声明来源钻瓜专利网。