[发明专利]基于流形学习数据压缩哈希的图像检索方法有效
| 申请号: | 201510250462.3 | 申请日: | 2015-05-15 |
| 公开(公告)号: | CN104881449B | 公开(公告)日: | 2018-03-06 |
| 发明(设计)人: | 王秀美;丁利杰;高新波;邓成;田春娜;王颖;韩冰;牛振兴 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 陕西电子工业专利中心61205 | 代理人: | 王品华,朱红星 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 流形 学习 数据压缩 图像 检索 方法 | ||
技术领域
本发明属于图像处理领域,更进一步涉及大规模图像数据的快速检索方法,可用于对图像进行二元编码,提高图像检索性能。
背景技术
随着互联网技术的快速发展以及数字多媒体的广泛应用,大量图像数据应运而生。海量的图像数据以及图像的复杂性给图像检索带来了巨大的挑战,如何快速准确地检索出人们需要的图像成为亟待解决的问题,图像检索更是成为了人们关注的焦点。但是传统的一些图像检索算法无法满足人们日益增长的需求。为了在大数据中高效地检索到有价值的图像,人们提出了哈希算法。哈希算法将高维图像数据映射到低维汉明空间,使用二进制编码表示图像。哈希算法既可以降低存储空间,也可以提高检索速度,因此研究基于哈希的图像检索技术具有重要意义。
天格科技(杭州)有限公司申请的专利“一种基于局部敏感哈希的相似人脸快速检索方法”(申请号:201310087561.5,公开号:CN103207898A)公开了一种基于局部敏感哈希的人脸图像哈希索引方法。该方法通过人脸区域检测、眼睛和嘴巴特征检测和特征提取、肤色检测、人脸肤色分布特征提取等步骤将图像表示为人脸特征向量,然后利用局部敏感哈希方法对人脸特征向量构建索引,从而提高查询时的速度。该专利申请提出的方法存在的不足之处是:该方法需要长代码保证高的查准率,但长代码使得查全率降低且耗费更多的存储空间;另外受随机性的影响,该方法的稳定性也不能令人满意。
大连理工大学提出的专利申请“基于多哈希表映射误差最小化的图像检索方法”(申请号:201110357850.3,公开号:CN102508910A)公开了一种基于多哈希表映射误差最小化的图像检索方法。该方法首先提取图像特征,再计算训练特征的主成分方向并采用迭代量化法对主成分方向进行优化,将待检索特征和查询特征投影到优化后的主成分方向上,得到其对应的哈希码;然后对先前训练特征进行能量弱化得到新的训练特征,重复该过程得到多组哈希码。该方法克服了单哈希表在召回率较高时汉明球半径较大的缺点,又采用相同哈希码长的多个哈希表,提高了检索的准确率。但是,该方法仍存在两方面的不足:一方面要通过线性降维方式得到主成分方向,不符合现实中大多数数据的非线性特性,且后续的迭代优化主成分方向过程会增加算法时间复杂度;另一方面针对大数据,多哈希表的使用增加了存储空间的占用率。
Yunchao Gong和Svetlana Lazebnik在文章“Iterative Quantization:A Procrustean Approach to Learning Binary Codes”(IEEE Conference on Computer Vision and Pattern Recognition,2011,pp.817-824)中提出一种迭代量化方法,该方法首先对图像提取底层特征,再使用主成分分析方法对底层特征降维,得到低维特征;然后对低维特征旋转并量化得到图像的编码。该方法使得旋转后的主成分方向的方差尽量保持平衡,提高了获取哈希编码序列的性能。但是,该方法的前提假设是图像数据服从高斯分布,而实际数据可能并不服从高斯分布,并且该方法没有考虑图像之间的近邻关系,使得图像检索的查准率和查全率降低。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于流形学习数据压缩哈希的图像检索方法,以节省哈希编码的存储空间,降低检索的时间复杂度,有效提高图像检索的查准率与查全率。
本发明的技术思路是:在训练模式下,对图像训练数据通过随机近邻压缩,得到训练数据的综合压缩数据集合,根据综合压缩数据集合,运用流形学习方法计算出训练数据的哈希值,得到图像训练数据哈希编码。在测试模式下,获得测试数据哈希编码,计算测试数据与训练数据哈希编码间的汉明距离,得到检索结果。
根据上述思路,本发明的实现步骤如下:
(1)调用图像数据库中原始图像,对原始图像数据进行特征提取,得到图像特征数据;
(2)对图像特征数据做归一化处理,得到归一化数据矩阵;
(3)从归一化数据矩阵中随机选取五分之一的数据矩阵作为图像测试数据矩阵VT,其余的数据矩阵作为图像训练数据矩阵VX;
(4)对图像训练数据矩阵VX进行随机近邻压缩,得到图像训练数据矩阵VX的综合压缩数据矩阵S:
4a)在图像训练数据矩阵VX中随机选取400个数据点,作为图像训练数据矩阵初始的综合压缩数据矩阵S';
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510250462.3/2.html,转载请声明来源钻瓜专利网。





