[发明专利]一种基于深度学习的动作识别方法在审
申请号: | 202010167013.3 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111401209A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 张宏;叶汉京;何力;管贻生;黄兴鸿;陈广诚 | 申请(专利权)人: | 佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 江金城 |
地址: | 528225 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 动作 识别 方法 | ||
1.一种基于深度学习的动作识别方法,其特征在于,包括如下步骤:
步骤S1:对视频帧F进行提取,划分为T*16帧,即F=(f1,f2,...,fT);
步骤S2:对每16帧fi进行光流提取得到相应的16张光流图;
步骤S3:利用多尺度的3D卷积神经网络分别对连续的16帧RGB图和光流图进行特征提取,分别得到两个特征向量xoriginal和xoptical;
步骤S4:将获得的两个特征向量串联在一起得到特征向量xi,维度为d1;
步骤S5:重复上述步骤并行处理T次,最终得到一个维度为(d1,T)的特征矩阵X;
步骤S6:通过一个以注意力机制为核心构建的一个网络,得到权值矩阵A;
步骤S7:将权值矩阵A代入公式M=A*XT获得新的特征矩阵M;
步骤S8:将新的特征矩阵M输入至LSTM网络,再经过全连接层的降维,得到特征向量Xfinal;
步骤S9:最后利用softmax进行分类,取最大值对应的类别为所识别的动作类别。
2.根据权利要求1所述的基于深度学习的动作识别方法,其特征在于,所述步骤S1中,如果视频帧F不足16帧,则对最后一帧图像进行复制补充即可。
3.根据权利要求1所述的基于深度学习的动作识别方法,其特征在于,所述步骤S2的多尺度包含多空间尺度和多时间尺度。
4.根据权利要求1所述的基于深度学习的动作识别方法,其特征在于,所述步骤S1还包括将视频每一帧图片缩放成224*224像素大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司,未经佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010167013.3/1.html,转载请声明来源钻瓜专利网。