[发明专利]一种双重补偿的多表哈希图像检索方法有效
申请号: | 201710088703.8 | 申请日: | 2017-02-20 |
公开(公告)号: | CN106777388B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 吴永贤;周先成;田星 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583;G06F16/532 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 双重 补偿 多表哈 希图 检索 方法 | ||
本发明公开了一种双重补偿的多表哈希图像检索方法,包括步骤:1)图像特征提取和类别信息处理;2)哈希表训练;3)根据哈希表将图像特征映射至汉明空间与类别权重计算;4)根据查询,计算汉明距离,返回查询结果;5)再排序操作。本发明方法在图像检索方面能够获得查询响应快,内存开销小,查询性能高的特点,并在多表哈希的图像检索方面有较大的改进,并克服了多表哈希需要额外开销的缺点。
技术领域
本发明涉及图像检索的技术领域,尤其是指一种双重补偿的多表哈希图像检索方法。
背景技术
随着互联网的发展,多媒体文件数量迅速增长,人们上传的图像也成了一个非常大的规模。这对图像检索问题有了非常大的挑战。传统的基于树形结构的检索方法,一般都需要许多额外的辅助空间,这甚至超过原始的图像数据的大小;而且一旦图像的特征维数很大的时候,基于树形结构的方法性能将会退化,甚至到了线性检索的复杂度。相反,基于哈希的图像检索方法始终拥有超线性的时间复杂度,而且需要的辅助空间也十分令人满意。
对于拥有F个哈希位的基于哈希的图像检索方法,首先将图像映射至低维的汉明空间。对于每一个图像都使用F个哈希位代表,并使用这些二进制位的汉明距离来衡量图像之间的相似度。对于一个良好的方法而言应该保证相似的图像拥有小的汉明距离,不相似的图像拥有大的汉明距离。本方法的查询过程如下:对于一个查询图像,本方法首先将图像映射至汉明空间,并计算查询图像与数据库中的图像之间的汉明距离,返回汉明距离较小的图像作为查询结果(由使用者设置的阈值决定)。由于哈希位可以用二进制位表示,汉明距离可以使用机器内置的位操作计算,因此基于哈希的图像检索方法可以使用较少的辅助内存,达到较快的检索速度,至于检索的准确度,则由方法的设计者保证了。
在基于哈希的图像检索领域,按照是否使用语义标签而言,可以分为有监督哈希,半监督哈希,无监督哈希三类。有监督哈希方法利用标签信息来训练哈希函数,要求数据库提供完整的标签信息;半监督哈希也利用了数据库中的标签信息,但容忍部分数据是无标签的;无监督哈希指的是那些不利用标签信息的哈希方法。图像数据库中的图像往往都拥有一些语义标签,这些信息可以很好的提升性能,无监督哈希方法忽略这些信息很可能损失检索性能,有监督哈希方法要求所有的图像都有语义标签,这也是不符合现实的,本方法是一种半监督哈希图像检索方法,能够很好的利用标签信息同时也更符合实际情况。
发明内容
本发明的目的在于克服现有哈希图像检索方法在多表检索上的不足,提出了一种双重补偿的多表哈希图像检索方法,该方法主要是体现了较为良好的性能,并且能够解决多表哈希在同等性能下需要更多开销的缺点。
为实现上述目的,本发明所提供的技术方案为:一种双重补偿的多表哈希图像检索方法,包括以下步骤:
1)图像特征提取和类别信息处理;
2)哈希表训练;
3)根据哈希表将图像特征映射至汉明空间与类别权重计算;
4)根据查询,计算汉明距离,返回查询结果;
5)再排序操作。
在步骤1)中,提取图像特征,并进行标签信息的处理,具体步骤如下:
1.1)使用gist算法提取图像特征,获取图像特征矩阵X,X=d×n,n为数据集图片数量,d为特征维数,对X矩阵进行中心化操作;
1.2)将图像分成两个子集:有语义标签的数据划分成有标签的图像子集,其特征矩阵为Xl,无语义标签的数据划分成无标签的图像子集,其特征矩阵为Xu;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710088703.8/2.html,转载请声明来源钻瓜专利网。