[发明专利]一种轻量化设计的动态手势识别神经网络模型在审

申请号：	202211520014.7	申请日：	2022-11-30
公开（公告）号：	CN115798043A	公开（公告）日：	2023-03-14
发明（设计）人：	褚明;刘建宁;陈宇;王子源;蔺绍奇	申请（专利权）人：	北京邮电大学
主分类号：	G06V40/20	分类号：	G06V40/20;G06V20/40;G06V10/82;G06V10/764;G06N3/045;G06N3/0464;G06N3/049
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种量化设计动态手势识别神经网络模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能研究和手势识别领域，一种轻量化设计的动态手势识别神经网络模型。其中，最重要的特征组成部分是注意力机制模块与轻量化特征提取LW‑ConvNeXt模块。注意力机制模块主要包含运动注意力机制Diff模块与通道注意力机制ECA模块；轻量化特征提取LW‑ConvNeXt模块构成了本神经网络的基本模块，是对特征提取ConvNeXt模块进行轻量化设计后得到的新模块。

技术领域

本发明涉及人工智能和手势识别领域，具体是一种轻量化设计的动态手势识别神经网络模型。

背景技术

随着人工智能与深度学习的发展，以及近些年数组孪生的兴起，手势识别、人机交互成为其中的一个研究热点；目前大多数数字孪生系统采用智能眼镜、手柄等交互设备进行交互，而基于视觉的手势交互能够使用户摆脱输入设备束缚，具有附着感低、侵入性弱以及交互体验更自然等优点；手势识别可以分为静态手势识别与动态手势识别，静态手势识别领域已经相对比较成熟，而动态手势识别由于其参数量更大、结构更加复杂、维度更高等问题存在，还有很大的发展空间。

发明内容

为了解决现有模型的不足之处，提出一种高精度、轻量化、能够满足实时性要求的动态手势识别模型。

为了达到上述目的，本发明提供了一种基于改进的注意力机制与ConvNeXt模块的手势识别神经网络模型，具体设计方案如下：

本模型的具体结构如下：输入为待识别的视频，经过预处理之后，输入下采样Stem模块，然后从整体结构上分为四个阶段，每个阶段有一个下采样模块以及若干个轻量化特征提取模块LW-ConvNeXt模块构成；各个阶段之间穿插注意力机制模块；最后通过全局平均池化以及全连接层完成手势识别。

输入数据的预处理过程如下：相邻帧之间由于相似程度高，有着大量的冗余特征，使用三帧差分法对视频进行处理，删除高于相似阈值的帧，使帧之间的动态特征更加明显，图像更加清晰；将处理完后的连续帧分成n段，每段取m帧，加上开头与结尾2帧，共同组成一组输入数据，因此一组数据为(n*m+2)帧。并对每帧图像进行像素归一化处理。

在二维注意力机制中，一般为空间-通道注意力机制，一方面突出图像空间上的特征，一方面突出不同通道上的特征，而在三维卷积中，简单的空间-通道注意力机制不能对时序上的特征进行很好的突出表达，而时序上的运动特征往往是视频中最重要的；因此设计了一种适用于三维视频输入的时间-空间混合注意力机制模块。

注意力机制模块具体设计如下：分为运动注意力机制Diff模块和通道注意力机制ECA模块；首先是运动注意力机制Diff模块；通过帧间差分的方式获得相邻帧之间的运动特征，对差分完重新拼接的数据通过卷积来对运动特征进行提取，突出数据中的运动特征表达；然后再通过最大值池化来调整维度，最后通过通道注意力机制ECA模块进行通道间注意力的特征提取，共同组成了本注意力机制模块；具体结构如图2所示。

卷积神经网络模型ConvNeXt是一个向transformer神经网络模型靠拢的纯卷积神经网络模型，提供了大量的训练技巧来提高模型的精确度；轻量化神经网络模型Shufflev2是一种典型的轻量化卷积神经网络模型。结合ConvNeXt和Shuffle v2两个神经网络模型的优点，对ConvNeXt神经网络进行轻量化改造，设计了轻量化ConvNeXt模块作为本网络的基本模块；命名为LW-ConvNeXt模块。

轻量化特征提取LW-ConvNeXt模块的具体设计如下：具体结构如图3所示，在特征提取ConvNeXt模块的基础上，为降低模型参数量，把卷积核大小从7改为3；使用深度可分离卷积代替一般的三维卷积；去掉逆瓶颈层；使用残差结构，经过逐通道卷积与逐逐点卷积的特征与输入做加法运算；然后进行数据归一化，并由激活函数进行激活，最后经过通道混洗，输出特征数据；该模块是LW-ConvNeXt神经网络的基础模块；输出与输入的通道数以及特征图大小不发生改变。

与现有技术相比，本发明的优点：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211520014.7/2.html，转载请声明来源钻瓜专利网。

上一篇：N-乙酰基保护氨基酸与其光学异构体的分离检测方法
下一篇：一种MOX组件一体化组装装置

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种轻量化设计的动态手势识别神经网络模型在审

专利文献下载