[发明专利]一种基于三重损失的改进的神经网络行人再识别方法有效
申请号: | 201611061867.3 | 申请日: | 2016-11-28 |
公开(公告)号: | CN106778527B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 舒泓新;蔡晓东;陈昀 | 申请(专利权)人: | 中通服公众信息产业股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 济南智圆行方专利代理事务所(普通合伙企业) 37231 | 代理人: | 张玉琳 |
地址: | 830000 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于三重损失的改进的神经网络行人再识别方法,包括以下步骤:构建样本数据库,并基于样本数据库建立正负样本库,随机选取两个正样本和一个负样本组成三元组;搭建基于三重损失的神经网络并训练,神经网络由三个并行的卷积神经网络连接一个三重损失层构成;将待测图片以及扩充后的样本数据库中的每一张样本图片依次作为一组输入投入到训练好的神经网络中,神经网络另一输入为零或无输入;再利用欧式距离计算出神经网络输出的两张输入图片的特征向量的距离,并查询出升序排列出前20位的欧式距离,再进行简单的人工筛选即可得到最终识别结果。本发明的有益效果是:本发明的识别方法能够适用于有较大变化的图片场景,能够保证鲁棒性,具有较高的识别准确率。 | ||
搜索关键词: | 一种 基于 三重 损失 改进 神经网络 行人 识别 方法 | ||
【主权项】:
1.一种基于三重损失的改进的神经网络行人再识别方法,其特征在于,所述识别方法包括以下步骤:步骤S1:构建样本数据库,并对样本数据库中的每一张样本图片通过平移、旋转和镜像方式进行数量扩充,由原来的一张样本图片扩充到八张样本图片组成一个小数据集;步骤S2:建立正负样本库;随机选取属于同一小数据集的两张样本图片左右拼接作为正样本,随机选取属于不同小数据集的两张样本图片左右拼接作为负样本;随机选取两个正样本和一个负样本组成三元组,或随机选取两个负样本和一个正样本组成三元组;步骤S3:制作正负样本库的样本标签,将正样本标记为1,负样本标记为0,通过caffe框架提供的工具将样本格式转换为lmdb格式并生成对应的均值文件;步骤S4:搭建基于三重损失的神经网络,所述神经网络由三个并行的卷积神经网络连接一个三重损失层构成;所述神经网络设有三个输入,包括两个相同样本输入和一个不同样本输入;所述三重损失层采用三重损失函数;步骤S5:所述步骤S2中构成的同一个三元组的三个元素作为神经网络的三个输入,对神经网络进行训练;步骤S6:将待测图片以及扩充后的样本数据库中的每张样本图片输入到训练好的神经网络中,神经网络另一输入为零或无输入;再利用欧式距离计算出神经网络输出的两张输入图片的特征向量的距离,并查询出升序排列出至少前20位的欧式距离,排序越靠前的欧式距离对应的样本图片与待测图片的相似度越高;其中,所述卷积神经网络包括五个并行的通道,其中一个通道用于提取全局特征,具体结构为:一个卷积层C1接池化层P1接卷积层C2接池化层P2接全连接层;另外四个通道用于提取局部特征,具体结构均为:一个卷积层C1接卷积层C2接全连接层;其中五个通道中的全连接层为一个,即五个通道的特征向量通过最后的全连接层,生成输入图片的最终特征向量;在输入卷积神经网络前,先将输入图片按照图片高度等分为四个局部图片,一个完整图片作为卷积神经网络全局特征提取通道的输入,四个局部图片作为卷积神经网络四个局部特征提取通道的输入。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服公众信息产业股份有限公司,未经中通服公众信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611061867.3/,转载请声明来源钻瓜专利网。