[发明专利]一种基于深度度量学习的服装检索技术在审
| 申请号: | 202010745141.1 | 申请日: | 2020-07-29 |
| 公开(公告)号: | CN111914109A | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 赵万磊;梁长辉;王菡子 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06F16/532 | 分类号: | G06F16/532;G06N3/04;G06N3/08 |
| 代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
| 地址: | 361005 福建*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 度量 学习 服装 检索 技术 | ||
1.一种基于深度度量学习的服装检索技术,其特征在于包括以下步骤:
1)模型设计:将一批服装图片经过卷积神经网络及全连接层得到特征嵌入;
2)采样方法:按照余弦相似度即已知的正负样本对的相似度信息,选取训练样本图片样本对;
3)损失函数:将步骤2)采样方法选取出来的图片样本对,带入设计的损失函数中计算损失,反传以训练模型。
2.如权利要求1所述一种基于深度度量学习的服装检索技术,其特征在于在步骤1)中,模型设计的具体方法为:一批数量为P×K的服装图片经过卷积神经网络及全连接层得到特征嵌入;其中,P代表随机选取P个类别的图片,K代表每一类随机选取K张图片;对于每一个图片,都有K-1个正样本对和(P-1)×K个负样本对,因此,一个训练批次的图片集合大小为P×K;选用在ImageNet上预训练过的Inception网络做为主干网络,在该主干网络后添加全局平均池化层,然后经过512维的嵌入层得到最终的特征嵌入。
3.如权利要求1所述一种基于深度度量学习的服装检索技术,其特征在于在步骤2)中,所述采样方法的具体步骤为:样本对之间两两计算余弦相似度si,j,按照余弦相似度即已知的正负样本对的相似度信息,采用以下规则选取训练样本:
2.1对于正样本图片对(i,j),若它们之间的相似度si,j满足:
si,j<τp
则会被选取,带入损失函数中计算损失;其中τp代表规定的正样本间隔;
2.2对于负样本图片对(i,j),若它们之间相似度si,j同时满足以下两点:
以及:
si,j>τn
满足上述条件的样本对会被选取,带入损失函数中计算损失;其中τn代表规定的负样本间隔,si,j为余弦相似度,而代表取与锚点最不相似的正样本的相似度再减去τb得到的值;只有当一个负样本图片对间的相似度同时比上述两者小的情况下,才会被选中代入损失函数中进行计算。
4.如权利要求1所述一种基于深度度量学习的服装检索技术,其特征在于在步骤3)中,所述损失函数的计算方法为:对于由采样方法选取出来的图片样本对,带入到设计的损失函数中计算损失,反传以训练模型,损失函数采用二项偏差损失
其中,α,β,λ为超参数,sa,b及sc,d为余弦相似度,P,N代表这一批次的正样本对与负样本对数量;本发明提出的损失函数为:
其中,Ec代表当前的迭代次数,Et代表训练所预先设置的总训练次数,是采样方法中所规定的正负样本间隔,均为常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010745141.1/1.html,转载请声明来源钻瓜专利网。





