[发明专利]基于三元组聚焦损失函数的行人再识别方法在审
申请号: | 201810738336.6 | 申请日: | 2018-07-06 |
公开(公告)号: | CN109190446A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 张世周;张艳宁;张琦;夏勇 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 常威威 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于三元组聚焦损失函数的行人再识别方法。首先,对输入的图像数据集进行分组,并选择用于特征提取的网络模型,设置其损失函数为三元组聚焦损失函数;然后,利用分组训练数据对网络进行训练,得到训练好的网络模型;最后,利用训练好的网络分别对数据库中的图像和待查询行人图像进行特征提取,计算特征向量间的欧式距离,根据距离大小判断识别结果。利用本发明方法,可以使难样本更聚焦,模型训练收敛性更好,行人识别精确度更高,识别性能更好。 | ||
搜索关键词: | 聚焦损失 三元组 特征提取 网络模型 图像 计算特征向量 图像数据集 分组 大小判断 模型训练 欧式距离 识别性能 损失函数 行人识别 训练数据 收敛性 样本 数据库 网络 聚焦 查询 | ||
【主权项】:
1.一种基于三元组聚焦损失函数的行人再识别方法,其特征在于步骤如下:步骤1:假设训练数据集中有N幅图像,将图像分组,每组训练数据随机挑选P个不同的行人,每个行人随机选K幅不同的图像,即一组训练数据包含P×K幅图像,对于每组训练数据中的每一幅图像,其本身为原样本,和原样本是相同行人的图像为正样本,和原样本是不同行人的图像为负样本,原样本、正样本和负样本共同构成一个三元组;其中,P的取值范围为25‑35,K的取值范围为2‑5;步骤2:选择残差网络Resnet50为用于特征提取的卷积神经网络,并设置网络的损失函数为以下三元组聚焦损失函数:
其中,LTFL表示损失函数,
表示原样本与所有正样本之间的最大欧式距离,
表示原样本与所有负样本之间的最小欧式距离,σ表示高斯核空间映射参数,σ=0.3,m表示人为设定的阈值参数,m=0.3;步骤3:将步骤1中得到的每组训练数据集分别输入步骤2的卷积神经网络,并设置训练次数为300,学习率为2×10‑4,采用随机梯度下降法进行训练,得到训练好的网络模型;步骤4:先利用训练好的网络模型对数据库中的所有图像进行特征提取,得到每幅图像的特征向量,利用训练好的网络模型对待查询行人图像进行特征提取,得到其特征向量;然后,计算待查询行人图像的特征向量和数据库中每幅图像的特征向量之间的欧式距离,并且按照欧式距离值从小到大对数据库中对应的图像进行排序,距离越近表示与待查询行人图像是同一个行人的可能性越大。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810738336.6/,转载请声明来源钻瓜专利网。