[发明专利]用于图像的模型训练方法以及无监督图像哈希检索方法在审
| 申请号: | 202211659632.X | 申请日: | 2022-12-22 |
| 公开(公告)号: | CN116310624A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V10/74;G06F16/53 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 于平 |
| 地址: | 100084 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 图像 模型 训练 方法 以及 监督 检索 | ||
1.一种用于图像的模型训练方法,其特征在于,包括:
获取无标签训练图像数据;
对所述无标签训练图像数据进行两次数据增广,获得第一增广数据以及第二增广数据;
利用预先构建的哈希特征提取模型分别对所述第一增广数据以及第二增广数据进行前向传播,获得第一预测值以及第二预测值;
基于所述第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,其中,所述损失函数基于谱对比学习算法构建;
根据所述损失值对所述预先构建的哈希特征提取模型中的网络参数进行更新,直到所述损失值小于损失阈值停止网络参数的更新,以获得训练好的哈希特征提取模型。
2.根据权利要求1所述的用于图像的模型训练方法,其特征在于,所述损失函数基于谱对比学习算法构建,包括:
构建所述第一增广数据与所述第二增广数据之间的图,所述图中的边表征所述第一增广数据与所述第二增广数据的联合概率分布;
利用所述预先构建的哈希特征提取模型输出的特征定义损失函数,利用定义得到的损失函数实现对所述图对应的邻接矩阵进行谱分解,从而获得基于谱对比学习算法构建的损失函数。
3.根据权利要求2所述的用于图像的模型训练方法,其特征在于,所述构建所述第一增广数据与所述第二增广数据之间的图,包括:
构建所述第一增广数据与所述第二增广数据之间的图A;
相应地,所述利用所述预先构建的哈希特征提取模型输出的特征,定义损失函数,包括:
获取所述图A对应的标准化邻接矩阵
基于矩阵分解的准则对所述标准化邻接矩阵进行谱分解,获得定义得到的损失函数l:
其中,F∈RN×k表示全体增广数据的k维特征矩阵;
利用预先构建的哈希特征提取模型f(x)输出特征矩阵F,并将所述标准化邻接矩阵转换为概率分布形式,以获得基于谱对比学习算法构建的损失函数l′:
其中,x和x+是随机数据增广对应的分布中的两个独立采样;x-为不同于无标签数据的数据所生成的增广数据。
4.根据权利要求3所述的用于图像的模型训练方法,其特征在于,所述基于所述第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,包括:
基于第一预测值zi=f(xi)以及第二预测值zi′=f(xi′),并根据损失函数l′,计算得到损失函数l′的随机估计,将该随机估计作为损失值,该损失值为:
其中,B为批量大小。
5.根据权利要求1所述的用于图像的模型训练方法,其特征在于,所述预先构建的哈希特征提取模型包括特征提取主干网络、激活层以及量化层;
相应地,所述利用预先构建的哈希特征提取模型分别对所述第一增广数据以及第二增广数据进行前向传播,获得第一预测值以及第二预测值,包括:
通过所述特征提取主干网络分别对所述第一增广数据以及第二增广数据进行特征提取,获得第一输出值以及第二输出值;
通过所述激活层以及量化层分别对所述第一输出值以及第二输出值进行转化,以获得二进制代码形式的第一预测值以及第二预测值。
6.根据权利要求1所述的用于图像的模型训练方法,其特征在于,所述根据所述损失值对所述预先构建的哈希特征提取模型中的网络参数进行更新,包括:
根据所述损失值,并利用直通估计器进行梯度的反向传播,以更新预先构建的哈希特征提取模型中的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211659632.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





