[发明专利]基于多任务生成对抗网络的跨视角步态识别方法有效
申请号: | 201710373017.5 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107085716B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 何逸炜;张军平 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 生成 对抗 网络 视角 步态 识别 方法 | ||
1.基于多任务生成对抗网络的跨视角步态识别方法,其特征在于,具体步骤为:
(1)输入不同视角下的行人视频帧序列,构造步态模版特征:
向量xi是视角i下的步态模版特征,nv是所有视角的数量;
(2)对于任意不同的视角u,v,使用卷积神经网络编码对应的步态模版特征xu至隐空间,并得到在隐空间中的隐表示为zu;
(3)在隐空间中对隐表示zu进行视角变换,变换至角度v,得到隐表示zv;
(4)将隐表示zv以及通道的独热编码作为输入,经过多任务生成对抗网络中的生成网络后输出角度v下的伪模版特征
(5)根据模版特征xu与伪模版特征计算逐像素损失Lp;
(6)使用多任务生成对抗网络中的判别网络,根据模版特征xu与伪模版特征计算多任务对抗损失La;
(7)加权逐像素损失与多任务对抗损失,根据总损失L=Lp+αLa训练多任务生成对抗网络;
α作为超参数用来权衡逐像素损失与多任务对抗损失,定义了最终的损失函数后,使用后向传播算法交替更新编码器、视角变换层、生成器与判别器的参数;
所述的步态模版的构建步骤为:
(1)对原始视频帧序列的每一帧进行前背景分离,提取出步态轮廓图;并将步态轮廓图平移缩放至图像中心,得到中心化的步态轮廓图序列B1,B2,B3,...,Bn};
(2)对中心化的步态轮廓图序列中每一帧,计算标准化的周期位置rt,表示中心化的步态轮廓图的第t帧的标准化的周期位置;
(3)根据中心化的步态轮廓图序列Bt和对应的标准化的周期位置rt,构造具有nc个通道的周期能量图PEI模版特征;周期能量图中第k个通道的(x,y)坐标处的值按下式计算:
其中:
m代表每个通道所覆盖的时间域窗口大小,T(k)决定了每个通道覆盖的时间域的范围;
所述多任务生成对抗网络主要由编码器、视角变换层、生成器和判别器四部分组成;其中:
(a)编码器:使用卷积神经网络作为模型中的编码器,编码器的输入xu是视角为u的PEI模版;输入的尺度大小为64×64×nc;PEI模版的每个通道被独立的送入编码器中,之后使用时间池化并经过全连接层后提取出有效的特征隐表示zu作为编码器的输出;
(b)视角变换层:假定步态数据随着视角的变化分布在一个高维的流形上,流形中的样本朝着特定的方向移动以保持身份信息的条件下实现视角的变化;给定隐空间的隐表示zu,视角变换可以描述为:
其中,hi表示由视角i-1到视角i的变换向量,zv是视角v下的隐表示;
(c)生成器:通过把隐表示zv作为输入,生成在视角v下的步态模版;生成器由五个反卷积层组成,并使用ReLU作为激励函数;随机选择PEI模版的一个通道进行重构,以此来保证隐表示能够保存所有通道的信息;定义生成器的输入为[zv,c],c为通道的独热编码表示;
(d)判别器:判别器的架构除了不采用时间池化操作以及输出层的维度和编码器不同外,其余结构和编码器相同;定义判别器的输出维度为nv+nc+nd,其中nv是视角的数量,nc是PEI通道的数量,nd是训练集中不同身份的数量;判别器的输出对应nv+nc+nd个子判别器,子判别器之间共享除了最后一层以外的参数;并且,每个判别器负责不同的判别任务来判断是否生成的样本属于特定的分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710373017.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:英语口语训练装置
- 下一篇:一种心脏复苏按压用的锻炼装置