[发明专利]行人重识别的方法及装置在审
申请号: | 201811522444.6 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109784166A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 冯维新;董远;白洪亮;熊风烨 | 申请(专利权)人: | 北京飞搜科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100876 北京市海淀区西土城路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全局特征向量 图像 神经网络模型 欧式距离 全局特征 特征向量 图像输入 分类信息 局部特征 输出目标 网络识别 网络使用 网络性能 训练过程 训练网络 人图像 测试 输出 分类 衡量 | ||
1.一种行人重识别的方法,其特征在于,包括:
将获取的若干个行人图像输入至预先训练的神经网络模型,输出各行人图像的特征向量,作为第一全局特征向量;将目标行人图像输入至预先训练的神经网络模型,输出目标行人图像的特征向量,作为第二全局特征向量;
计算所述第二全局特征向量与各所述第一全局特征向量间的欧式距离,选取欧式距离最近的若干个行人图像作为所述目标行人图像的行人重识别结果;
其中,所述神经网络模型具体通过以下步骤训练:
获取行人图像的样本集,所述样本集中的样本预先配置对应的行人ID的标签;将所述样本集中的样本输入至残差网络中,输出第一特征矩阵;根据所述第一特征矩阵分别提取样本的全局特征向量和局部特征向量;
根据所述样本的全局特征向量以及标签,使用交叉熵函数计算分类损失;根据所述样本的全局特征向量获取样本的三元组,根据三元组的全局特征向量和局部特征向量分别计算三元组的全局距离损失和局部距离损失;
根据所述分类损失、三元组的全局距离损失和三元组的局部距离损失优化所述神经网络模型中的参数。
2.根据权利要求1所述的方法,其特征在于,根据所述第一特征矩阵分别提取样本的全局特征向量和局部特征向量,具体为:
定义第一特征矩阵为l通道,m*n大小,将样本的第一特征矩阵输入平均池化层,输出l通道的特征向量,作为样本的全局特征向量;
将样本的第一特征矩阵输入水平池化层对每行向量取均值,输出高度为m,宽度为1的第二特征矩阵,将所述第二特征矩阵输入至1*1大小的卷积层,输出o通道,m*1大小的第三特征矩阵,作为所述样本的局部特征向量,其中o小于l。
3.根据权利要求1所述的方法,其特征在于,所述根据所述样本的全局特征向量以及标签,使用交叉熵函数计算分类损失,具体为:
将所述全局特征向量输入至所述神经网络模型的全连接层,输出所述样本对应各行人ID的概率,通过交叉熵公式计算分类损失:
其中,x[i]表示样本x对应标签的概率,x[j]表示样本x对应标签j的概率,i∈J,j∈J。
4.根据权利要求1所述的方法,其特征在于,所述根据样本的全局特征获得三元组的步骤,具体为:
根据样本集中各样本的全局特征向量,计算两两样本间的全局距离;对于任意一个样本,选取与所述样本具有相同标签且全局距离最大的图像作为正样本,选取与所述样本具有不同标签且全局距离最小的图像作为负样本,将一个样本及所述样本的正样本和负样本作为一个三元组。
5.根据权利要求1所述的方法,其特征在于,所述根据三元组的全局特征计算三元组的全局距离损失,具体为:
根据样本与正样本间的全局距离减去样本与负样本的全局距离,获得所述三元组的全局距离损失;
其中,根据以下公式计算两个样本间的全局距离:
其中,x和y分别表示两个样本,其中,xi表示样本x的第i个通道的特征向量,yi表示样本y的第i个通道的特征向量,样本的通道数为n。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司,未经北京飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811522444.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序