[发明专利]一种基于序列保留哈希的超低复杂度图像检索方法有效
申请号: | 201611127943.6 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106777038B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 纪荣嵘;林贤明;刘弘 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/46;G06K9/62 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 序列 保留 复杂度 图像 检索 方法 | ||
一种基于序列保留哈希的超低复杂度图像检索方法,涉及图像检索。对于图像库中的图像,随机选取一部分图像作为训练集,并抽取相应的图像特征;采用非线性主成分分析方法将原图像特征降低维度到与哈希编码相同的长度;利用K‑means聚类算法得一系列的支撑点,作为后续哈希函数学习的基础;通过迭代优化学习对应的哈希函数;输出对应的哈希函数并计算整个图像库的哈希编码;对于查询图像,先抽取对应的GIST特征,根据训练得到的哈希编码函数对图像特征进行哈希编码,之后计算查询图像的哈希编码与图像库中的图像特征编码之间的汉明距离,利用汉明距离大小衡量查询图像与图像库中待检索图像之间的相似性,返回相似度高的图像。
技术领域
本发明涉及图像检索,具体是涉及一种基于序列保留哈希的超低复杂度图像检索方法。
背景技术
随着互联网技术的发展,网络中的图像数据量呈指数级别的增长。如何高效地组织、管理以及分析这些数据显得十分重要。基于内容的图像检索(Content Based ImageRetrieval,CBIR)技术应运而生,受到了学术界和工业界的广泛关注。通常,CBIR系统可分为两大部分:1、图像的特征表达;2、高效的检索算法。
图像的特征表达是提取图像的相关特征对图像的内容进行描述,例如VLAD特征(具体内容可以参见文章H,Jegou,M.Douze,C.Schmid and P.Perez“Aggregating localdescriptors into a compact image representat ion”,In the proceeding ofcomputer vision and pattern recognition,2011),然后通过特征的相似度计算查找与目标图像相似的图像。
然而,由于网络中图像数据规模非常庞大,暴力搜索不能解决实际问题。因此,如何解决特征压缩和高效存储、以及如何实现大规模数据的快速检索与索引就显得更为重要。在以往的研究中,基于树的索引方案和基于哈希编码的方案得到了学术界和工业界的广泛关注。当特征维度较高时,基于树的索引方案将会转变为穷尽搜索。图像的特征表达的维度都非常高,基于树的索引方案很难实现海量高维图像的检索需求。哈希算法是目前在大规模数据搜索中得到广泛采纳的方案。哈希算法主要思想是将高维度的实数特征表达根据图像的语义相关度,将相似的特征表达通过编码长度相同且汉明距离相差不大的二进制哈希码进行表示。哈希算法一方面可以通过较少的存储空间来存储大规模的数据,另一方面哈希编码之间的汉明距离可以实现高效计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611127943.6/2.html,转载请声明来源钻瓜专利网。