[发明专利]一种基于三重损失的改进的神经网络行人再识别方法有效
申请号: | 201611061867.3 | 申请日: | 2016-11-28 |
公开(公告)号: | CN106778527B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 舒泓新;蔡晓东;陈昀 | 申请(专利权)人: | 中通服公众信息产业股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 济南智圆行方专利代理事务所(普通合伙企业) 37231 | 代理人: | 张玉琳 |
地址: | 830000 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三重 损失 改进 神经网络 行人 识别 方法 | ||
1.一种基于三重损失的改进的神经网络行人再识别方法,其特征在于,所述识别方法包括以下步骤:
步骤S1:构建样本数据库,并对样本数据库中的每一张样本图片通过平移、旋转和镜像方式进行数量扩充,由原来的一张样本图片扩充到八张样本图片组成一个小数据集;
步骤S2:建立正负样本库;随机选取属于同一小数据集的两张样本图片左右拼接作为正样本,随机选取属于不同小数据集的两张样本图片左右拼接作为负样本;随机选取两个正样本和一个负样本组成三元组,或随机选取两个负样本和一个正样本组成三元组;
步骤S3:制作正负样本库的样本标签,将正样本标记为1,负样本标记为0,通过caffe框架提供的工具将样本格式转换为lmdb格式并生成对应的均值文件;
步骤S4:搭建基于三重损失的神经网络,所述神经网络由三个并行的卷积神经网络连接一个三重损失层构成;所述神经网络设有三个输入,包括两个相同样本输入和一个不同样本输入;所述三重损失层采用三重损失函数;
步骤S5:所述步骤S2中构成的同一个三元组的三个元素作为神经网络的三个输入,对神经网络进行训练;
步骤S6:将待测图片以及扩充后的样本数据库中的每张样本图片输入到训练好的神经网络中,神经网络另一输入为零或无输入;再利用欧式距离计算出神经网络输出的两张输入图片的特征向量的距离,并查询出升序排列出至少前20位的欧式距离,排序越靠前的欧式距离对应的样本图片与待测图片的相似度越高;
其中,所述卷积神经网络包括五个并行的通道,其中一个通道用于提取全局特征,具体结构为:一个卷积层C1接池化层P1接卷积层C2接池化层P2接全连接层;另外四个通道用于提取局部特征,具体结构均为:一个卷积层C1接卷积层C2接全连接层;其中五个通道中的全连接层为一个,即五个通道的特征向量通过最后的全连接层,生成输入图片的最终特征向量;在输入卷积神经网络前,先将输入图片按照图片高度等分为四个局部图片,一个完整图片作为卷积神经网络全局特征提取通道的输入,四个局部图片作为卷积神经网络四个局部特征提取通道的输入。
2.根据权利要求1所述的基于三重损失的改进的神经网络行人再识别方法,其特征在于,所述步骤S1中样本图片数量扩充具体为:每一张样本图片分别进行左上、右上、左下、右下四个方向的平移,平移的尺度为:y=height×(±0.5),x=width×(±0.5);沿以样本图片的中心分别按逆时针和顺时针分别旋转5°;对样本图片进行镜像,通过上述方式,一张样本图片扩充为八张样本图片。
3.根据权利要求1或2所述的基于三重损失的改进的神经网络行人再识别方法,其特征在于,所述步骤S5中,采用三重损失函数针对三元组中的每个元素或样本,训练一个参数共享或者不共享的网络,得到三个元素对应的特征表达,分别记为
所述三重损失函数如下:
其中,从正负样本库中随机选的一个正样本或负样本,定义其名称为Anchor并即为x_a,然后再随机选取的两个与Anchor属于同一类的样本和属于不同类的样本,分别定义其名称为Positive并记为x_p和Negative并记为x_n,由此构成一个(Anchor,Positive,Negative)三元组,其中,三重损失函数中α,为x_a与x_n之间距离和x_a与x_p之间距离的间隔。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服公众信息产业股份有限公司,未经中通服公众信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611061867.3/1.html,转载请声明来源钻瓜专利网。