[发明专利]一种基于注意机制的卷积递归神经网络的动作识别方法有效

专利信息
申请号: 201710337015.0 申请日: 2017-05-17
公开(公告)号: CN107273800B 公开(公告)日: 2020-08-14
发明(设计)人: 葛宏伟;宇文浩;闫泽航 申请(专利权)人: 大连理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04
代理公司: 大连理工大学专利中心 21200 代理人: 梅洪玉
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于计算机视觉动作识别领域,提出了一种基于注意机制的的卷积递归神经网络的动作识别方法,用以解决在动作识别中无法有效的提取显著性区域的问题,提高了分类的准确性。本方法首先利用卷积神经网络自动地对动作视频进行特征提取;然后利用空间转换网络在特征图的基础上实现了注意机制,利用注意机制操作提取特征图中的显著区域,生成目标特征图;最后将目标特征图输入卷积递归神经网络中,产生最后的动作识别结果。实验证明所提方法在UCF‑11和HMDB‑51等基准动作视频测试集上取得了很好的效果,提高了动作识别的准确性。
搜索关键词: 一种 基于 注意 机制 卷积 递归 神经网络 动作 识别 方法
【主权项】:
一种基于注意机制的卷积递归神经网络的动作识别方法,其特征在于,包括如下步骤:步骤1:利用卷积神经网络自动地对视频帧图像进行特征提取,提取最后一个卷积层的特征图U作为后续操作的输入;步骤2:利用空间转换网络对视频的特征图进行转换处理;1)对步骤1产生的输入特征图U进行池化操作,得到1维的特征向量;将多帧特征向量输入到递归神经网络中,产生后续所需要的转换参数θ;2)对步骤1产生的输入特征图U的空间坐标位置进行归一化,同时限定输出特征图的空间坐标位置也在[‑1,1]之间,利用1)中产生的转换参数θ构建可微分的空间变换Tθ,利用空间变换Tθ和输出特征图V的坐标产生在输入特征图U中的采样点的坐标,如下式所示:xisyis=Tθ(Gi)=Tθxityit1=θ11θ12θ13θ21θ22θ23xityit1---(1)]]>其中是输出特征图的目标坐标,是输入特征图中采样点的坐标,Tθ是仿射变换矩阵;3)利用采样内核在2)中提取到的采样点坐标上进行采样操作,得到输出特征图V中每一个坐标位置的值,产生输出特征图V;采样操作如下:Vic=ΣnHΣmWUnmck(xis-m;Φx)k(yis-n;Φy)∀i∈[1...H′W′]∀c∈[1...C]---(2)]]>其中Фx和Фy是定义采样内核k()参数,是输入通道c中坐标位置(n,m)的值,是通道c中坐标位置处的像素i的输出值;对输入特征图的每个通道进行相同的采样,继而每个通道以相同的方式进行转换,保持了通道之间的空间一致性;步骤3:将步骤2中产生的输出特征图V输入到卷积递归神经网络中,卷积递归神经网络是一种循环的结构,每一次循环产生一个对于当前帧的类别预测,最后得到所有帧的预测结果;卷积递归神经网络的操作如下:其中“*”表示卷积运算符和表示Hadamard积,Wx~和Wh~表示的是卷积核,输入门i(t),忘记门f(t),输出门o(t),记忆单元c(t)和c(t‑1),隐藏状态h(t)和h(t‑1)都是3D张量;步骤4:统计步骤3中所有时刻得到的关于帧类别的预测,利用这些预测进行动作的分类;对视频的所有帧的类别进行投票,然后把投票得分最多的类别作为该视频最后的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710337015.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top