[发明专利]基于最优K均值哈希算法的大规模图像库检索方法有效
申请号: | 201410440852.2 | 申请日: | 2014-09-01 |
公开(公告)号: | CN104199923B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 张树武;张桂煊;郭勤振;曾智 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于最优K均值哈希算法的大规模图像库检索方法,包括从待检索图像库中选取部分图像作为训练图像集,首先提取训练集图像的GIST特征;对训练集的特征数据进行特征值分配预处理;将经过预处理的特征数据划分成多个子空间;对每一个子空间训练出该子空间的码本和码本的编码;对待检索图像库和查询图像中特征数据的处理与训练过程对应,分别提取检索图像和查询图像的GIST特征,然后计算待检索图像和查询图像特征的哈希编码,之后计算待检索图像特征编码和查询图像特征编码两者之间的汉明距离,由此快速检索相似图像。本发明具有很好的普适性,既减少了数据的存储空间又提高了查询的检索效率。 | ||
搜索关键词: | 基于 最优 均值 算法 大规模 图像 检索 方法 | ||
【主权项】:
一种基于最优K均值哈希算法的大规模图像库检索方法,包括以下步骤:步骤S1,提取待检索图像库中选取的训练集中的图像的GIST特征,利用得到的GIST特征来训练得到码本和码本的编码,该步骤S1具体包括:步骤S11:从待检索图像库D={D1,D2,...,DN}中选取部分图像T={T1,T2,...Tn}作为训练集,其中N为待检索图像库的大小,n为训练集的大小,n≤N;步骤S12:对所述训练集T中的图像提取d维的GIST特征,其中图像Ti的GIST特征记为xi,将训练集中所有图像的GIST特征组成矩阵X,X的第i行由xi构成;步骤S13:对所述训练集中图像的GIST特征进行特征值分配预处理,计算均值μ和投影矩阵P;步骤S14:将经过预处理之后的特征数据均匀地划分为m个子空间,特征矩阵X在第u个子空间的数据记为X(u),其中1≤u≤m,特征xj在第u个子空间的数据记为如下式所示,xjp为xj的第p维,1≤p≤d,t为子空间的维数,t=d/m,步骤S15:在每一个子空间内分别计算该子空间的码本C(u)和码本的编码其中u为第u个子空间;该步骤S15进一步包括:步骤S151:初始化子空间内的码本,对于第u个子空间,随机选择子空间X(u)内的2b个数据作为初始码本C(u),其中其每一行为一个码字,b=k/m,为每个子空间的编码位数;k为总的编码位数;步骤S152:初始化子空间内码本的编码,利用PCA哈希对码本进行初始化编码,具体如下,首先利用PCA将码本降到b维,假设降维后的码本为则对码本的初始编码为满足:步骤S153:初始化放缩常量α,利用下式计算αα=ΣiΣjIS(i,j)·S(i,j)b·n,]]>其中为利用PCA将子空间X(u)降到b维的结果;Is∈{‑1,1}n×b为S的PCA哈希编码,n为训练集中图像的个数;步骤S154:更新码本C(u)和码本的编码使得下式取最小值,O=1nΣi=1n||xi(u)-c(xi(u))||2+λΣi=12bΣj=12bwij(D(ci,cj)-H(I(ci),I(cj)))2,]]>其中,表示C(u)中离最近的码字,ci,cj分别代表码本C(u)中第i,j个码字,即C(u)的第i,j行;I(ci)和I(cj)分别代表码字ci,cj的编码,即的第i,j行;wij=ninj/n2,ni,nj分别代表ci和cj形成的簇中训练数据的个数;D(ci,cj)为ci和cj的欧氏距离,Dh(I(ci),I(cj))为I(ci)和I(cj)之间的汉明距离;λ为权重系数;步骤S2,利用步骤S1得到的码本和码本的编码来计算待检索图像库中的图像的完整编码;步骤S3,提取查询图像的GIST特征,利用步骤S1得到的码本和码本的编码来计算所述查询图像的完整编码,并计算所述查询图像的编码与所述待检索图像库中每一幅图像的编码之间的汉明距离,利用距离大小来衡量所述查询图像与所述待检索图像库中图像之间的相似性,返回待检索图像库中与查询图像汉明距离最小的L个图像作为检索结果,其中L为用户预先设定的正整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410440852.2/,转载请声明来源钻瓜专利网。