[发明专利]用于图像的模型训练方法以及无监督图像哈希检索方法在审
| 申请号: | 202211659632.X | 申请日: | 2022-12-22 |
| 公开(公告)号: | CN116310624A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V10/74;G06F16/53 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 于平 |
| 地址: | 100084 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 图像 模型 训练 方法 以及 监督 检索 | ||
本发明提供一种用于图像的模型训练方法以及无监督图像哈希检索方法,包括:获取无标签训练图像数据;对无标签训练图像数据进行两次数据增广,获得第一增广数据以及第二增广数据;利用预先构建的哈希特征提取模型分别对第一增广数据以及第二增广数据进行前向传播,获得第一预测值以及第二预测值;基于第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,其中,损失函数基于谱对比学习算法构建;根据损失值对预先构建的哈希特征提取模型中的网络参数进行更新,直到损失值小于损失阈值以获得训练好的哈希特征提取模型。本发明能够实现无监督的知识迁移,具有更好的泛化能力且注重了对重要语义信息的刻画,提升检索效率。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种用于图像的模型训练方法以及无监督图像哈希检索方法。
背景技术
相似性搜索,也称近似最近邻搜索,其具体可以是基于内容的图像和文档搜索,或者是多媒体检索和抄袭检测等。在大数据时代,相似性搜索在现代信息检索系统中发挥着举足轻重的作用。
现有技术中,若直接在原始的实值特征空间中进行搜索,则会因为数据量巨大,对应的存储和计算的成本都非常高,降低检索效率。而哈希技术通过将数据表示为保留语义相似性的紧凑的二进制代码,并计算代码间的汉明距离来实现检索,显著减少了内存占用并提高了搜索效率,从而解决上述问题,也是最近几年研究的重点。
现有的哈希方法大致分为基于有监督学习的方式和基于无监督学习的方式。一方面,基于有监督学习的哈希在训练过程中依赖于数据标注,往往通过度量学习的优化目标来保证语义相近的数据具有接近的二进制表示代码,而语义不同的数据在汉明空间中远离。基于有监督学习的哈希通常表现很好,但其泛化能力有限,例如,在人脸数据集上基于监督信息训练的哈希系统,往往很难泛化到植物数据集的细粒度检索任务上。
另一方面,现有的大量有竞争力的无监督哈希方法都是基于对数据进行重建的目标来训练。例如,先通过解重建图像和原始图像之间误差的离散优化问题来找到二进制代码,之后,为了降低计算复杂度,变分自编码器被训练以直接输出哈希码,该变分自编码器在训练过程中被强制要求从二进制代码出发重建原始图像。也有基于生成对抗网络探索类似的构思。由此可以看出,上述无监督方法真正做的是基于数据重构的目标,从而要求二进制代码尽可能多地保留原始数据的信息。然而,在哈希任务中,目的并不是保留原始数据的所有信息,而是保留所关注的语义相关的信息。例如,图像背景对于人脸数据上的相似性搜索是无用的,但如果采用数据重构为目标,二进制代码中可能会包含大量背景相关的信息,而损失对于重要的语义信息的刻画。
综上所述,现有技术中基于有监督学习的哈希方法泛化能力有限,而基于无监督学习的哈希方法给出的二进制代码中包含大量无效冗余信息,因此亟需一种泛化性能好且又能够注重对重要语义信息刻画的哈希方法。
发明内容
本发明提供一种用于图像的模型训练方法以及无监督图像哈希检索方法,用以解决上述问题。
本发明提供一种用于图像的模型训练方法,包括:
获取无标签训练图像数据;
对所述无标签训练图像数据进行两次数据增广,获得第一增广数据以及第二增广数据;
利用预先构建的哈希特征提取模型分别对所述第一增广数据以及第二增广数据进行前向传播,获得第一预测值以及第二预测值;
基于所述第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,其中,所述损失函数基于谱对比学习算法构建;
根据所述损失值对所述预先构建的哈希特征提取模型中的网络参数进行更新,直到所述损失值小于损失阈值停止网络参数的更新,以获得训练好的哈希特征提取模型。
根据本发明提供的一种用于图像的模型训练方法,所述损失函数基于谱对比学习算法构建,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211659632.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





