[发明专利]一种基于三重损失的改进的神经网络行人再识别方法有效
申请号: | 201611061867.3 | 申请日: | 2016-11-28 |
公开(公告)号: | CN106778527B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 舒泓新;蔡晓东;陈昀 | 申请(专利权)人: | 中通服公众信息产业股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 济南智圆行方专利代理事务所(普通合伙企业) 37231 | 代理人: | 张玉琳 |
地址: | 830000 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三重 损失 改进 神经网络 行人 识别 方法 | ||
本发明公开了一种基于三重损失的改进的神经网络行人再识别方法,包括以下步骤:构建样本数据库,并基于样本数据库建立正负样本库,随机选取两个正样本和一个负样本组成三元组;搭建基于三重损失的神经网络并训练,神经网络由三个并行的卷积神经网络连接一个三重损失层构成;将待测图片以及扩充后的样本数据库中的每一张样本图片依次作为一组输入投入到训练好的神经网络中,神经网络另一输入为零或无输入;再利用欧式距离计算出神经网络输出的两张输入图片的特征向量的距离,并查询出升序排列出前20位的欧式距离,再进行简单的人工筛选即可得到最终识别结果。本发明的有益效果是:本发明的识别方法能够适用于有较大变化的图片场景,能够保证鲁棒性,具有较高的识别准确率。
技术领域
本发明涉及图像识别技术领域,特别涉及一种基于三重损失的改进的神经网络行人再识别方法。
背景技术
随着科技的进步,计算机等智能设备在人们的日常生活中应用越来越广泛,计算机在处理重复的,数据密集的任务时,比人类更有效,更准确。自然地人们希望计算机能够像人类一样处理一些更智能的问题。在计算机新的应用领域中计算机视觉是一个重要的部分,由计算机代替或辅助人类完成对目标的检测与跟踪是计算机视觉最核心也是最广泛的应用,从日常生活中用到的指纹或人脸解锁,到汽车的自动驾驶,机器人控制等都与计算机视觉技术息息相关。人类是社会生活的主体,对行人的识别理所当然的也是计算机视觉应用中最重要的任务之一。但由于人体姿态多变,外形不固定且随着衣着的变化表现的颜色特征也不同,目前仍然是一个极富挑战的课题,但因其广泛的应用前景,虽然行人检测任务面临着众多困难,仍然吸引了大量研究者的目光。
目前的行人在识别方法多是使用softmax回归来使卷积神经网络收敛,生成模型进行人分类方法,但当图片场景有较大变化时不能够保证鲁棒性,无法适用于多个场景(即背景固定的图,可移植性不好)。
发明内容
本发明提供了一种在测试样本大、角度变化大、光照复杂时仍能够具有高精确度的基于三重损失的改进的神经网络行人再识别方法。
为了实现上述目的,本发明提供了一种基于三重损失的改进的神经网络行人再识别方法,具体包括以下步骤:
步骤S1:构建样本数据库,并对样本数据库中的每一张样本图片进行数量扩充,由原来的一张样本图片扩充到八张样本图片组成一个小数据集;具体地,一张样本图片分别进行左上、右上、左下、右下四个方向的平移,平移的尺度为:y=height×(±0.5),x=width×(±0.5);沿以样本图片的中心分别按逆时针和顺时针分别旋转5°;对样本图片进行镜像,通过上述方式,一张样本图片扩充为八张样本图片;其中,样本数据库可以基于已公开的CUHK01库和VIPER库建立,对上述数据库中的图片进行扩充得到本发明所需的样本数据库;或,样本数据库也可以由小区高清摄像头或其他高清摄像头采集的图片,并采用Opencv人脸检测对采集的所有图片进行行人检测,去掉无行人的噪音,保留的照片进行数量扩充即为本发明所需的样本数据库;
步骤S2:建立正负样本库;随机选取属于同一小数据集的两张样本图片左右拼接作为正样本,随机选取属于不同小数据集的两张样本图片左右拼接作为负样本;正样本数量为15万-35万之间,负样本数量大于等于正样本数量的1/3;优选地,正样本数量为30万,负样本数量为15万;进一步地,从正负样本库中随机选一个正样本或负样本,定义其名称为Anchor并即为x_a,然后再随机选取两个与Anchor属于同一类的样本和属于不同类的样本,分别定义其名称为Positive并记为x_p和Negative并记为x_n,由此构成一个(Anchor,Positive,Negative)三元组;
步骤S3:制作正负样本库的样本标签,将正样本标记为1,负样本标记为0,通过caffe框架提供的工具将样本格式转换为lmdb格式并生成对应的均值文件;具体地,首先遍历样本文件夹下所有图片,将其正样本文件夹下的所有图片名读出来写到txt文件并标记为1,将其负样本文件夹下的所有图片名读出来写到txt文件夹并标记为0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服公众信息产业股份有限公司,未经中通服公众信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611061867.3/2.html,转载请声明来源钻瓜专利网。