[发明专利]一种海量图像检索的隐私保护索引生成方法有效
申请号: | 201410244992.2 | 申请日: | 2014-06-04 |
公开(公告)号: | CN104008174B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 卓力;成博;白宇;彭远帆;张燕;张菁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种海量图像检索的隐私保护索引生成方法,涉及海量图像检索中的隐私保护问题,将隐私保护融入到图像检索中,本发明方法建立一种具有隐私保护的图像索引,在保证检索性能的同时,保护用户隐私信息的安全。本发明首先,提取并优化尺度不变特征转换SIFT和HSV颜色直方图,采用局部保持投影的流形降维方法对特征进行降维,并将降维后的特征数据用于构建词汇树。利用词汇树建立倒排索引结构,本发明不仅减少了特征的个数,提高了明文域图像检索的速度,更优化了图像检索的性能。本发明在明文域检索框架的基础上加入隐私保护,利用二元随机编码和随机投影对倒排索引进行双重加密,实现了具有隐私保护的图像索引。 | ||
搜索关键词: | 一种 海量 图像 检索 隐私 保护 索引 生成 方法 | ||
【主权项】:
一种海量图像检索的隐私保护索引生成方法,包括:尺度不变特征转换SIFT和HSV颜色直方图的提取和优化、局部保持投影LPP降维、词汇索引构建以及隐私保护索引生成,其特征在于包括如下步骤:步骤1:SIFT特征和HSV直方图特征的提取和优化,构建图像特征库;步骤1.1:提取SIFT特征;步骤1.2:对SIFT进行合理优化:对SIFT描述符集中的区域进行优化整合,以较少数量的描述符对图像内容进行准确的表征,设定图像中第i个SIFT描述符的横纵坐标分别为Siftdes[i].x,Siftdes[i].y,优化阈值为Topt,优化范围为Ropt;对于任意两个不同的SIFT描述符Siftdes[i]与Siftdes[j],当两点的横坐标和纵坐标的距离均小于优化阈值Topt时,则表示这些点存在于需要优化的范围Ropt内,需要进行优化操作,即:将存在于Ropt内的所有特征点合并成一个特征点,以它们的均值代表该范围内的所有特征点;如果该两点的横坐标距离或者纵坐标距离大于优化阈值Topt时,则表示这些点无需进行优化,优化方法如下:优化后的SIFT特征点个数明显减少,提高检索速度;步骤1.3:提取HSV颜色直方图特征;步骤1.4:利用SIFT特征和HSV直方图特征共同形成图像特征库;步骤2:利用LPP对图像特征进行降维;步骤2.1:构建邻接图,计算图上每个点x的k最邻域点,计算每条边的权重Wij,不相连的边权重为0,否则为1,计算特征向量方法如下:XLpXTa=λXDdiaXTa其中,图像特征X∈RD×N,N为样本个数,每个样本有D维特征,Ddia是对角矩阵,Dii=∑jWji;Lp=Ddia‑W,Lp是半正定的拉普拉斯矩阵,W是由权重Wij构成的稀疏对称矩阵;步骤2.2:依据约束条件aTXDdiaXTa=1,计算最小化函数,方法如下:argmina=aTXLpXTa]]>其中,前d个最小的非零特征值对应的特征向量即为投影矩阵;步骤2.3:利用投影矩阵A={ai}∈RD×d(d<D,ai≠0),找到数据的低维嵌入表示,方法如下:Y=ATX其中,Y即为降维后的特征向量;步骤3:词汇树索引的构建;步骤3.1:随机的选取K个初始聚类中心Ci;步骤3.2:使用分层K‑means,计算聚类中心Ci与每个特征点的距离,并把与聚类中心距离最小的点归到以Ci为聚类中心的类中;步骤3.3:重新计算每个聚类中心Ci;步骤3.4:计算判断聚类中心Ci与所属以Ci为聚类中心的类的特征点之间的距离是否满足收敛阈值,如果不满足,则重复步骤2、步骤3,直到满足收敛阈值且聚类中心不再发生变化;步骤3.5:继续对聚类得到的K个簇集利用K‑means算法聚类,再分成K个簇集,重复步骤3.1‑步骤3.4,直至达到词汇树的高度L时,停止聚类,形成特征词汇树,其中K=10,L=3;步骤3.6:统计每个特征点的词频‑倒排文件频率TF‑IDF加权,其中TF表示的是词频,词汇树中的节点i,对每一个视觉单词Ci,查询图像和数据库中图像通过节点i的特征数分别为qi和di,IDF计算方法如下:IDF=logNNi=ωi]]>其中,N是图像库的图像总数,Ni是包含节点i的图像的数量,查询图像的索引向量为Qi=qiwi,数据库中图像的索引向量表示为Di=diwi;步骤4:隐私保护索引的生成;步骤4.1:将数据库的索引F={fi}放大1,000,000倍,四舍五入成为整数,找到最大的整数,将倒排索引利用二进制数表示,方法如下:其中fimax为最大的整数索引,Digmax为二进制的最大位数;步骤4.2:将所有整数形式的索引表示为二进制数,将位数不足Digmax的二进制数前补零,方法如下:其中Digi表示的是b(fi)的二进制位数;步骤4.3:将所有整数依次提取b(fi)的n个bit位,将b(fi)重新排列为新的向量,方法如下: b(fi)=[b(fi1),b(fi2),...,b(fim)]其中m=Digmax/n,经过二元随机编码的倒排索引表示为其中N是图像的数量,dnew是经过二元随机编码后,新索引的维度;步骤4.4:使用高斯随机投影矩阵进行随机投影,其中dnew是原始维度,d'是降维后的维度,加密函数定义为:ε(b(F))=b(F)·G';步骤4.5:图像的索引完成随机投影之后,利用L1范数对加密索引的距离进行度量,方法如下:dϵ(Similar)=dϵ(ϵ(b(fi),b(fi)))i≠j=||ϵ(b(fi))-ϵ(b(fj))||1]]>步骤4.6:对相似性结果进行排序,将最终将前k幅图像返回显示给用户,方法如下:dε(Similar)=αdε(SimSIFT)+βdε(SimHSV)其中α,β分别为SIFT特征词汇树和HSV直方图词汇树的匹配权重,α=1.5,β=0.3,dε(SimSIFT)为基于SIFT特征词汇树加密索引的距离,dε(SimHSV)为HSV直方图词汇树加密索引的距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410244992.2/,转载请声明来源钻瓜专利网。
- 上一篇:啤酒阀
- 下一篇:一种橡胶凹凸内齿导向型同步聚酯输送带
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序