[发明专利]一种大规模图片集分布式近似搜索的方法在审
申请号: | 201710333386.1 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107315765A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 胡海峰;吕成钢 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 高玲玲 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种大规模图片集分布式近似搜索的方法。图片分布存储在多个服务器结点中,在各结点并行训练时使用反映了图片间内在语义一致性的转换矩阵来计算图片间的优化相似度。随机抽取部分图片作为抽样图片集来度量图片间的相似性,并在训练转换矩阵时采用随机梯度下降法减少算法的训练时间。通过优化相似度得到用于编码的相似矩阵后,使用哈希技术把图片映射为二进制编码。在新的查询图片进行近似搜索时,首先传入各结点计算查询图片的编码,再引入加权汉明距离模型,当图片和查询图片的汉明距离小于设定的汉明距离门限阈值时,作为查询图片的近似图片。本发明解决了传统的集中式哈希算法在大规模图片集应用中效率过慢和性能不佳的问题。 | ||
搜索关键词: | 一种 大规模 图片集 分布式 近似 搜索 方法 | ||
【主权项】:
一种大规模图片集分布式近似搜索的方法,其特征在于:所述方法包括如下步骤:步骤1:输入图片数据集样本矩阵X,X是n*d维的矩阵,n是图片的个数,d是图片特征的维度,和对应的语义类标记矩阵Y,Y是n*c维的矩阵,n是样本个数,c是类标记的个数,假设有I个服务器结点,图片集中的样本矩阵均匀分为I部分:X=[X1,X2,…,XI],类标记矩阵也相应地分为I部分:Y=[Y1,Y2,…,YI],每一部分数据和对应的标记存储在一个结点上;步骤2:从各服务器结点的图片样本中随机抽取一部分图片作为抽样图片集,计算图片和抽样图片之间的相似度;步骤3:引入语义一致性构建目标函数表达式O(Ai),其中Ai是d*d维的方阵,d是图片特征的维度,i代表第i个服务器结点,Ai是在编码阶段需要的转换矩阵;步骤4:在各结点中,对于每一个图片样本x,用转换矩阵Ai乘以图片样本x和抽样图片之间的相似度,得到了引入语义一致性之后的优化相似度,然后再利用哈希技术进行编码,将图片由原始的d维特征压缩映射成k维的二进制编码;步骤5:对于新的查询图片,分别输入到各结点中,并行计算出此查询图片的二进制编码,并通过加权模型得到各结点中查询图片的汉明距离向量;步骤6:合并各结点的汉明距离向量,得到查询图片相对于图片集中所有图片的汉明距离向量,如果图片在汉明距离向量中对应位置的元素值小于设定的汉明距离门限阈值r,以此图片作为查询图片的近似图片。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710333386.1/,转载请声明来源钻瓜专利网。