[发明专利]一种无监督图像深度哈希检索方法及系统在审
申请号: | 202110958840.9 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113722529A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 李阳;王亚鹏;王家宝;苗壮;赵昕昕;张睿;李航 | 申请(专利权)人: | 中国人民解放军陆军工程大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210014 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 图像 深度 检索 方法 系统 | ||
本发明公开了一种无监督图像深度哈希检索方法及系统,包括:将待检索图像输入预先得到的哈希特征提取网络,得到该图像的哈希码;计算与哈希码数据库中图像的哈希码的汉明距离并排序,汉明距离越小检索排名越靠前,输出排名最靠前的图像作为检索结果。本发明能够解决现有基于卷积神经网络无监督深度哈希图像检索方法无法有效学习全局特征以及缺少注意力机制的问题。
技术领域
本发明涉及一种无监督图像深度哈希检索方法及系统,属于计算机视觉与图像检索技术领域。
背景技术
随着互联网上图像数据的急剧增长,如何在数以万亿的图像数据库中快速检索到内容相似的数据成为图像检索技术的核心问题。图像检索的性能体现在两个方面:检索速度与检索精度。由于图像哈希特征在图像检索中不但可以保持较高检索精度,同时能满足大规模检索的速度要求,因此被广泛应用于各类大规模图像检索系统中。
根据图像哈希特征学习过程的不同,通常图像哈希特征学习可分为有监督学习和无监督学习。目前,有监督哈希学习方法中,基于深度卷积神经网络的方法应用最广。虽然该方法可以实现高精度快速查询,但由于有监督深度学习过程中需要大量的有标签数据,需要耗费大量的人工标注时间,代价十分昂贵。因此,基于无标签数据的深度无监督哈希学习方法成为当前的研究热点,受到广泛关注。
当前,图像无监督深度哈希学习方法中,都是依赖于卷积神经网络作为模型进行学习。例如,申请号为201710071669.3,公开号为CN106980641A的中国专利中提出了一种基于卷积神经网络构建三元组损失的无监督图像哈希学习方法。虽然该方法通过三元组损失可以进一步提升哈希模型的检索精度,但由于卷积神经网络本身缺乏全局特征学习能力以及缺乏注意力机制,因此其学习性能依然存在局限性。
综上所述,虽然现有的基于卷积神经网络的无监督深度哈希检索方法避免了大量标注图像的成本,同时具有较好的检索性能和检索速度。但与有监督深度哈希方法的检索精度相比,此类方法仍存在较大差距。如何充分发挥无监督学习模型自身的学习能力,进一步提升无监督深度哈希检索性能,已成为研究者们关注的重点。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种无监督图像深度哈希检索方法及系统,以解决现有基于卷积神经网络无监督深度哈希图像检索方法无法有效学习全局特征以及缺少注意力机制的问题。为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种无监督图像深度哈希检索方法,包括:
获取待检索图像;
将待检索图像输入预先得到的哈希特征提取网络,得到该图像的哈希码;计算与哈希码数据库中图像的哈希码的汉明距离并排序,汉明距离越小检索排名越靠前,输出排名最靠前的图像作为检索结果;
其中所述哈希特征提取网络和哈希码数据库是通过以下步骤得到的:
获取无标签图像数据,利用获取到的图像数据构建样本对;
基于构建的样本对,利用预设的损失函数采用梯度更新和动量更新对预先构建的无监督对比哈希学习网络进行参数更新;
选取更新完成的无监督对比哈希学习网络中利用梯度更新的分支作为哈希特征提取网络;
将获取到的无标签图像数据输入所述哈希特征提取网络,得到图像的二值哈希特征,合并生成哈希码数据库。
结合第一方面,进一步地,所述预先构建的无监督对比哈希学习网络,包括两个结构相同参数不同的视觉Transformer模型,在两个视觉Transformer模型输出层后,嵌入哈希编码层。
结合第一方面,进一步地,所述视觉Transformer模型包含多头自注意力模块和多层神经网络模块。
结合第一方面,优选地,所述多头自注意力模块和多层神经网络模块为ViT模型结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学,未经中国人民解放军陆军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110958840.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序