[发明专利]基于轻量化三维卷积网络的行为识别方法在审

专利信息
申请号: 201910498020.9 申请日: 2019-06-10
公开(公告)号: CN110210439A 公开(公告)日: 2019-09-06
发明(设计)人: 李映;王校男;张号逵 申请(专利权)人: 西北工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 西北工业大学专利中心 61204 代理人: 刘新琼
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明利用洗牌层、空间卷积和时间卷积分解,分组卷积等,设计构建一个轻量化的三维卷积神经网络来处理行为识别问题。该轻量化三维卷积网络能够,在保证识别精度的同时,显著的减少网络参数量、运算量及计算开销,提升网络执行速度。
搜索关键词: 轻量化 卷积 三维 行为识别 卷积神经网络 网络 计算开销 空间卷积 网络执行 积分解 运算量 构建 洗牌 分组 保证
【主权项】:
1.一种基于轻量化三维卷积网络的行为识别方法,其特征在于步骤如下:步骤1:数据预处理沿着时间维对待识别的视频段,进行裁剪,得到时间长度一致的短视频;步骤2:划分训练集验证集从标注了行为类别的视频集合中提取少量视频作为验证集,其余视频作为训练集;步骤3:构建轻量化三维卷积网络网络模型所述的轻量化三维卷积网络的结构依次是:(1)一个BN层;(2)一个宽度为64,卷积核尺寸为1×7×7的三维卷积层,一个宽度为64,卷积核尺寸为7×1×1的,步长为(2,1,1)的卷积层;(3)窗口尺寸为1×3×3,步长为(1,2,2)的最大池化层;(4)宽度为64的pointwise卷积层;(5)宽度64,卷积核尺寸1×3×3的卷积层,宽度192卷积核尺寸3×1×1的卷积层;(6)窗口尺寸为1×3×3,步长为(1,2,2)的最大池化层;(7)宽度依次为256和480的轻量化模块3b和3c;(8)窗口尺寸为3×3×3,步长为(2,2,2)的最大池化层;(9)宽度依次为512、512、512、528和832的轻量化模块4b、4c、4d、4e和4f;(10)窗口尺寸为2×2×2,步长为(2,2,2)的最大池化层;(11)宽度依次为832和1024的轻量化模块5b和5c;(12)窗口尺寸为2×7×7,步长为(2,2,2)的平均池化层,宽度为64的pointwise卷积层;所述的轻量化模块包含四个分支通道,第一条通道由一个pointwise分组卷积层构成,第二条通道及第三条通道均由一层point wise卷积层、一层卷积核为1×3×3的分组卷积层、及卷积核为3×1×1的分组卷积层构成;第四条通道由一个最大池化层及一个pointwise分组卷积层构成;该模块在正向运算过程中,先将输入数据平均分为16组,然后通过洗牌操作让各组信息互相混合,再将16组信息按照比例分配为四组,依次输入给四个分支通道,最后将各分支通道的结果按通道合并,得到轻量化模块的输出;步骤4:数据导入定义视频数据具体导入方式,为网络训练做准备;步骤5:训练网络模型依照定义的数据导入方式,并行的从不同时间长度的多个视频里提取相同时间长度的视频片段作为训练数据;将训练数据批量的输入到构建好的轻量化三维卷积网络中,以视频片段的标注的类别为指导信号,利用梯度下降算法对网络参数进行训练,直至网络收敛;在验证集上评估训练的网络模型,并防止过拟合;步骤6:实用将步骤1中处理好的待处理数据输入到训练好的模型中,进行识别,给出最终的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910498020.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top