[发明专利]一种基于双流神经网络的人体图像动作识别方法在审
申请号: | 201711038331.4 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107862376A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 吴昊宣;吴贺俊 | 申请(专利权)人: | 中山大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/00 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双流 神经网络 人体 图像 动作 识别 方法 | ||
1.一种基于双流神经网络的人体图像动作识别方法,其特征在于:包括以下步骤:
S1.构建时间神经网络和空间神经网络;
S2.为时间神经网络和空间神经网络准备足够多的训练视频,然后从训练视频中提取信息对时间神经网络、空间神经网络进行训练,提取信息的步骤如下:
S21.设对视频帧分段的次数为k,k的初始值为1;
S22.将训练视频的视频帧划分为多段,然后分别采集多段视频帧的RGB信息和光流图信息;
S23.令k=k+1然后对每段视频帧执行步骤S22的处理,直至k>a,a为设定的视频分段的次数阈值;
S24.将步骤S2采集的RGB信息输入至空间神经网络中对空间神经网络进行训练,而将步骤S2采集的光流图信息输入至时间神经网络中对时间神经网络进行训练;
S3.分别计算时间神经网络和空间神经网络的损失函数数值,然后判断时间神经网络和空间神经网络的损失函数数值是否小于设定的阈值,若是则结束对时间神经网络和空间神经网络的训练,否则基于时间神经网络和空间神经网络的损失函数数值对时间神经网络和空间神经网络的参数进行迭代更新,然后重复步骤S2对时间神经网络和空间神经网络的训练;
S4.对于测试视频,将其按照步骤S21~S23进行信息的提取,然后将提取的测试视频的RGB信息和光流图信息分别输入至空间神经网络、时间神经网络中,将空间神经网络、时间神经网络的输出融合后得到动作识别结果。
2.根据权利要求1所述的基于双流神经网络的人体图像动作识别方法,其特征在于:所述视频帧的光流图信息由视频帧及与视频帧相邻的另一视频帧确定,设视频帧t上的一个像素点为(u,v),则将其移动至视频帧t+1上对应位置的光流向量表示为dt(u,v),视频帧t上的每一个像素点均对应着一个光流向量,通过提取所有像素点的光流向量,即可得到一张与视频帧t对应的光流图。
3.根据权利要求1所述的基于双流神经网络的人体图像动作识别方法,其特征在于:所述a设为2。
4.根据权利要求3所述的基于双流神经网络的人体图像动作识别方法,其特征在于:所述测试视频提取的RGB信息表示如下:{{S11,S12,……,S1m},{S21,S22,……,S2m},…,{Sn1,Sn2,……,Snm}},其中Sij表示第一次划分的第i段里,再次划分后第j段提取的RGB信息,所述训练视频/测试视频提取的光流图信息表示如下:{{S′11,S′12,……,S′1m},{S′21,S′22,……,S′2m},…,{S′n1,S′n2,……,S′nm}},S′ij表示第一次划分的第i段里,再次划分后第j段提取的光流图信息,则步骤S4将提取的测试视频的RGB信息和光流图信息分别输入至空间神经网络、时间神经网络中,空间神经网络、时间神经网络的输出Prediction1(V)、Prediction2(V′)表示如下:
Prediction1(V)
=H1(G(F1(S1,S11,S12,……,S1m),……,Fn(SN,Sn1,Sn2,……,Snm)))
Prediction2(V′)
=H2(G(F1(S′1,S′11,S′12,……,S′1m),……,Fn(SN,S′n1,S′n2,……,S′nm)))
Fi函数表示在第一次划分中,将第i段提取的信息S1或S′1融合起来,并加入第i段自身再次划分提取的信息;函数G将各段的信息整合堆叠,形成统一的输入形式,最终输入到空间神经网络或时间神经网络中,函数H1和H2分别代表空间与时间神经网络的网络内计算过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711038331.4/1.html,转载请声明来源钻瓜专利网。