[发明专利]一种基于深度哈希的类别失衡图像分层检索方法在审
申请号: | 202210571972.0 | 申请日: | 2022-05-24 |
公开(公告)号: | CN115080781A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李冰;赵生捷;姚晗 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06N3/04;G06N3/08;G06V10/40;G06V10/764;G06V10/774 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 类别 失衡 图像 分层 检索 方法 | ||
1.一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,具体包括以下步骤:
S1、获取训练数据集输入到网络模型的特征提取模块,经多个卷积层处理后得到图像的高维特征向量;
S2、高维特征向量输入到网络模型的隐含层,隐含层根据高维特征向量来学习图像的特征表示,同时输出图像对应的近似哈希码;
S3、近似哈希码经激活函数与量化处理后形成离散的二进制串,作为最终哈希码输入到隐含层的分类层中,分类层通过二次检索方法计算出图库中对应的图像,完成分类模型的训练;
S4、将待检索图像输入到完成训练的分类模型中,输出待检索图像在图库中对应的图像。
2.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述隐含层的结构具体为采用1*1卷积核和全局平均池化操作,或采用分块全连接层的结构。
3.根据权利要求2所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述1*1卷积核对高维特征向量进行降维操作,全局平均池化操作对特征图进行压缩,将生成的特征图内数据取均值作为输出。
4.根据权利要求2所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述分块全连接层对高维特征向量的处理过程具体为将高维特征向量分为多个特征片段,每个特征片段通过一个全连接层生成输出结点,公式如下:
fci(x(i))=Wix(i)
其中,x(i)为特征片段,Wi为对应的参数矩阵,fci为输出结点的特征值。
5.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述步骤S3中计算最终哈希码的公式如下所示:
其中,为最终哈希码对应的二进制串,σ为Tanh激活函数,f(x)为近似哈希码,Wh和bh为过程参数。
6.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述分类层中设有损失函数,所述损失函数中增加少样本类别在训练中所对应的损失权重,并且减少易区分样本对应的损失权重。
7.根据权利要求6所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述损失函数的公式如下所示:
其中,Loss(p,q)为交叉熵损失函数,N为类别数,p为标签对应的独热码向量,q为神经网络输出后经过softmax层输出的概率,下标i表示第i个样本,下标k表示真实标签,α为权重因子,β为调节因子。
8.根据权利要求7所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述调节因子的计算公式如下所示:
β=(1-qi)γ
其中,γ为超参数并且γ≥0。
9.根据权利要求6所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述网络模型在训练时以原始网络在ImageNet数据集上预训练的结果作为新网络中原有层的初始参数,随机初始化隐含层的参数值,根据损失函数计算得到的损失值,采用反向传播算法在新的数据集上进行训练,利用随机梯度下降方法最小化损失值。
10.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法,其特征在于,所述步骤S3中二次检索方法的过程具体为第一步根据最终哈希码对图像库进行检索,第二步根据特征向量对图像库进行检索,综合两步的结果得到最终检索出的目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210571972.0/1.html,转载请声明来源钻瓜专利网。