[发明专利]一种轻量化设计的动态手势识别神经网络模型在审

专利信息
申请号: 202211520014.7 申请日: 2022-11-30
公开(公告)号: CN115798043A 公开(公告)日: 2023-03-14
发明(设计)人: 褚明;刘建宁;陈宇;王子源;蔺绍奇 申请(专利权)人: 北京邮电大学
主分类号: G06V40/20 分类号: G06V40/20;G06V20/40;G06V10/82;G06V10/764;G06N3/045;G06N3/0464;G06N3/049
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 量化 设计 动态 手势 识别 神经网络 模型
【说明书】:

发明涉及人工智能研究和手势识别领域,一种轻量化设计的动态手势识别神经网络模型。其中,最重要的特征组成部分是注意力机制模块与轻量化特征提取LW‑ConvNeXt模块。注意力机制模块主要包含运动注意力机制Diff模块与通道注意力机制ECA模块;轻量化特征提取LW‑ConvNeXt模块构成了本神经网络的基本模块,是对特征提取ConvNeXt模块进行轻量化设计后得到的新模块。

技术领域

本发明涉及人工智能和手势识别领域,具体是一种轻量化设计的动态手势识别神经网络模型。

背景技术

随着人工智能与深度学习的发展,以及近些年数组孪生的兴起,手势识别、人机交互成为其中的一个研究热点;目前大多数数字孪生系统采用智能眼镜、手柄等交互设备进行交互,而基于视觉的手势交互能够使用户摆脱输入设备束缚,具有附着感低、侵入性弱以及交互体验更自然等优点;手势识别可以分为静态手势识别与动态手势识别,静态手势识别领域已经相对比较成熟,而动态手势识别由于其参数量更大、结构更加复杂、维度更高等问题存在,还有很大的发展空间。

发明内容

为了解决现有模型的不足之处,提出一种高精度、轻量化、能够满足实时性要求的动态手势识别模型。

为了达到上述目的,本发明提供了一种基于改进的注意力机制与ConvNeXt模块的手势识别神经网络模型,具体设计方案如下:

本模型的具体结构如下:输入为待识别的视频,经过预处理之后,输入下采样Stem模块,然后从整体结构上分为四个阶段,每个阶段有一个下采样模块以及若干个轻量化特征提取模块LW-ConvNeXt模块构成;各个阶段之间穿插注意力机制模块;最后通过全局平均池化以及全连接层完成手势识别。

输入数据的预处理过程如下:相邻帧之间由于相似程度高,有着大量的冗余特征,使用三帧差分法对视频进行处理,删除高于相似阈值的帧,使帧之间的动态特征更加明显,图像更加清晰;将处理完后的连续帧分成n段,每段取m帧,加上开头与结尾2帧,共同组成一组输入数据,因此一组数据为(n*m+2)帧。并对每帧图像进行像素归一化处理。

在二维注意力机制中,一般为空间-通道注意力机制,一方面突出图像空间上的特征,一方面突出不同通道上的特征,而在三维卷积中,简单的空间-通道注意力机制不能对时序上的特征进行很好的突出表达,而时序上的运动特征往往是视频中最重要的;因此设计了一种适用于三维视频输入的时间-空间混合注意力机制模块。

注意力机制模块具体设计如下:分为运动注意力机制Diff模块和通道注意力机制ECA模块;首先是运动注意力机制Diff模块;通过帧间差分的方式获得相邻帧之间的运动特征,对差分完重新拼接的数据通过卷积来对运动特征进行提取,突出数据中的运动特征表达;然后再通过最大值池化来调整维度,最后通过通道注意力机制ECA模块进行通道间注意力的特征提取,共同组成了本注意力机制模块;具体结构如图2所示。

卷积神经网络模型ConvNeXt是一个向transformer神经网络模型靠拢的纯卷积神经网络模型,提供了大量的训练技巧来提高模型的精确度;轻量化神经网络模型Shufflev2是一种典型的轻量化卷积神经网络模型。结合ConvNeXt和Shuffle v2两个神经网络模型的优点,对ConvNeXt神经网络进行轻量化改造,设计了轻量化ConvNeXt模块作为本网络的基本模块;命名为LW-ConvNeXt模块。

轻量化特征提取LW-ConvNeXt模块的具体设计如下:具体结构如图3所示,在特征提取ConvNeXt模块的基础上,为降低模型参数量,把卷积核大小从7改为3;使用深度可分离卷积代替一般的三维卷积;去掉逆瓶颈层;使用残差结构,经过逐通道卷积与逐逐点卷积的特征与输入做加法运算;然后进行数据归一化,并由激活函数进行激活,最后经过通道混洗,输出特征数据;该模块是LW-ConvNeXt神经网络的基础模块;输出与输入的通道数以及特征图大小不发生改变。

与现有技术相比,本发明的优点:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211520014.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top