[发明专利]一种C3D改进方法及机加车间人体行为识别方法在审
申请号: | 202210720942.1 | 申请日: | 2022-06-24 |
公开(公告)号: | CN114973106A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 李自胜;胡朝海;肖晓萍 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/20;G06V10/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 621010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 c3d 改进 方法 车间 人体 行为 识别 | ||
1.通道激励模块改进方法,其特征在于:
借鉴ACTION-Net算法中通道激励模块CE,并对CE进行改进,得到改进后的通道激励模块ICE,利用ICE激励和感知C3D卷积网络提取特征的通道信息;
所述ACTION-Net算法是一种用于动作识别的卷积网络模块;
所述通道是图像的颜色通道,彩色图像的通道数为3,灰度图的颜色通道为1;
所述激励是对通道卷积运算增加图像的通道数,以提取图像的多通道特征,特征提取的输出图像称为特征图;
所述通道卷积运算增加图像的通道数,是通道经卷积运算后,其特征图通道数为2的n次幂,n为卷积核数量,当n=5时,经过卷积运算得到的特征图通道数为25=32,n=6时,经过卷积运算得到的特征图通道数为26=64,n=10时,经过卷积运算得到的特征图通道数为210=1024;
所述CE,即通道激励模块(Channel Excitation module)的简称;
所述ICE,即改进后的通道激励模块(Improved Channel Excitation module)的简称;
通道激励模块改进方法,包括以下步骤:
S11、对输入通道激励模块的特征图进行最大池化操作;
S12、对池化操作后的特征图进行3D卷积运算;
S13、改变池化操作后的特征图shape(形状),使得特征图的shape为3;
S14、对改变shape后的特征图进行1D卷积运算;
S15、改变1D卷积运算特征图的shape;
S16、对改变shape后的特征图进行3D卷积运算;
S17、通过Sigmoid激活函数对3D卷积运算后的特征图进行缩放;
S18、将缩放后的特征图与原始输入特征图逐元素相乘;
S19、将逐元素相乘后的特征图与原始输入特征图逐元素相加。
2.C3D改进方法,其特征在于:
将ICE嵌入C3D卷积网络,得到改进C3D后的卷积网络IC3D,将IC3D用于机加车间人体行为识别;
所述C3D是一种用于视频特征提取的3维卷积网络;
所述IC3D是改进C3D后的卷积网络(Improved Convolution 3D,IC3D)的简称;
所述将ICE嵌入到C3D卷积网络,是利用Python语言把权利要求1中的ICE编写为程序模块,加入到C3D卷积网络的第一个池化层之后。
3.机加车间人体行为识别方法,其特征在于:
利用IC3D提取机加车间人体视频段数据的时间特征和空间特征,改变提取特征的维数,并输入到全连接层,根据全连接层的输出实现行为识别;
机加车间人体行为识别方法包括以下步骤:
S31、用训练数据集训练IC3D网络,得到网络模型参数;
S32、加载网络模型参数,利用测试数据对IC3D进行测试;
用训练数据集训练IC3D网络,得到网络模型参数,包括以下步骤:
S3101、载入公开数据集UCF-101,将UCF-101数据集前60%的视频数据用于训练网络模型,中间20%的视频数据用于验证网络模型,后20%的视频数据用于测试网络模型;
S3102、设置全体样本训练次数epochs=120,每批样本数batchsize=16,初始学习率为α=0.0001,动量参数momentum=0.9,权重衰减因子为γ=0.0005;
S3103、数据预处理,在每个视频段数据中抽出16帧图像进行堆叠,得到一个shape为5的训练数据;
S3104、将网络提取到的特征输入全连接层;
S3105、将全连接层输出的特征经Softmax函数运算,把特征值映射到0到1之间;
S3106、选择特征值映射后最大值所对应行为类别,作为网络训练结果,保存模型参数;
加载模型参数,利用测试数据对IC3D进行测试包括以下步骤:
S3201、将训练好的模型参数加载到改进后的IC3D网络中;
S3202、将测试视频数据输入IC3D网络进行测试;
S3203、根据公式评价网络模型精度,其中,P表示测试精度,xi表示输入数据,yi是xi的标签,f表示网络模型IC3D,f(xi)表示网络模型IC3D对xi的识别结果,n表示输入数据的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210720942.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工件表面缺陷检测方法
- 下一篇:一种产业化提取罗马洋甘菊油的工艺方法