[发明专利]一种基于集成哈希编码的快速图像检索方法有效
申请号: | 201510200864.2 | 申请日: | 2015-04-23 |
公开(公告)号: | CN104765872A | 公开(公告)日: | 2015-07-08 |
发明(设计)人: | 李鹏;卢宝周;任鹏 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 青岛联信知识产权代理事务所 37227 | 代理人: | 徐艳艳 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 编码 快速 图像 检索 方法 | ||
1.一种基于集成哈希编码的快速图像检索方法,其特征在于:具体包括以下步骤:
(1)给定数据库,将其分为训练图像数据库和查询图像数据库,对每一幅训练图像ti(1≤i≤n)和查询图像uj(1≤j≤q)分别提取SIFT特征并利用K-均值聚类将其量化表示为d维的特征向量,其中n和q分别为训练图像和查询图像的数量,则所有训练图像的特征向量可以组成一个训练图像特征向量库X=[x1,x2,...,xn]T,其中X为n×d维的矩阵,X的每一行xi分别为相应训练图像ti的特征向量,所有查询图像的特征向量可以组成一个查询图像特征向量库Y=[y1,y2,...,yq]T,其中Y为q×d维的矩阵,Y的每一行yj分别为相应查询图像uj的特征向量;
(2)选取现有的M种不同图像哈希算法对训练图像的特征向量库X分别进行初始哈希编码,得到的初始哈希编码矩阵分别记为Hm(m=1,…,M),其中是一个维度为n×rm、元素取值为-1或者1的矩阵,每一行代表一幅训练图像的初始哈希编码,n为训练图像总数,rm为第m种哈希算法的编码长度;
(3)从训练图像的特征向量库X中随机按行挑选k幅图像得到一个子矩阵X’,维度是k×d,同时对应地从每一个初始哈希编码矩阵Hm中分别按行随机选取一个子矩阵H’m,维度是k×rm,在每一种哈希算法的初始哈希编码子矩阵H’m基础上,通过向量的内积来计算两幅训练图像的初始哈希编码之间的相似度,其中第m种哈希算法下的训练图像的初始哈希编码之间的相似度计算公式为:
式中,Sm为第m种哈希算法下的训练图像的初始哈希编码相似度矩阵,维度是k×k,Sm中的每一个元素表示第i幅训练图像与第j幅训练图像在第m种哈希算法下的相似度数值(1≤i≤k,1≤j≤k),并且的值越大表示两幅图像的初始哈希编码越相似,反之则越不相似,代表矩阵H’m的转置;
(4)按照下面的公式计算M种不同哈希算法下的训练图像的初始哈希编码之间的平均相似度:
式中,S为融合了M种不同哈希算法的初始哈希编码相似度的平均相似度矩阵,维度是k×k;
(5)在平均相似度矩阵S的基础上,利用集成学习算法中的一致性约束准则进行图像哈希编码的再学习,所述一致性约束准则是指由再学习得到的集成哈希编码计算得出的相似度要与M种不同哈希算法的平均相似度矩阵S相一致,具体过程通过最小化下面的目标函数实现:
式中,为学习得到的集成哈希编码矩阵,每一行代表一幅训练图像的集成哈希编码,r*为集成哈希编码的长度,若集成哈希编码采用线性映射的形式,则上述目标函数可以写为:
式中,为集成哈希映射矩阵,维度是d×r*,作用是将图像从特征空间映射到汉明空间,sign(.)为取符号函数;
(6)对于查询图像特征向量库中的任意一幅查询图像的特征向量yj(1≤j≤q),利用集成哈希映射矩阵将其映射到汉明空间,得到其集成哈希编码hy,同时对训练图像的特征向量库X重新进行集成哈希编码,计算hy与每一幅训练图像的集成哈希编码之间的汉明距离,如果汉明距离的值小于阈值β,则把该幅训练图像作为对应查询图像uj的相似图像返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510200864.2/1.html,转载请声明来源钻瓜专利网。