[发明专利]一种基于循环三维卷积神经网络的手势识别方法在审

申请号：	201710625653.2	申请日：	2017-07-27
公开（公告）号：	CN107590432A	公开（公告）日：	2018-01-16
发明（设计）人：	袁家政;刘宏哲;邓智方	申请（专利权）人：	北京联合大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京驰纳智财知识产权代理事务所(普通合伙)11367	代理人：	谢亮
地址：	100101 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于循环三维卷积神经网络手势识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及人机智能交互的技术领域，特别是一种基于循环三维卷积神经网络的手势识别方法。

背景技术

手势识别是计算机科学和语言技术中的一个主题，目的是通过数学算法使计算机能够识别人类手势，实现人与计算机之间的有效交流与控制。手势以其直观、自然和易于学习的人机交互的优势和不需要专门的硬件配合的情况下实现智能化的信息交换和处理，受到了越来越多的企业及学者的关注，其中目前应用于无人驾驶以及VR领域中手势识别就是一种简单的手势识别。它是一种通过深度学习技术，能够理解用户的手势，并提供对应应答或指令操作的人工智能系统。

公开号为CN104182772A的专利文件公开了一种基于循环三维卷积神经网络的手势识别方法，，包括以下步骤：对采集到的手势图像进行降噪处理、消除手势图像中的色彩偏移现象；采用帧间差分方法和颜色特征检测方法锁定手势在图像中的所在区域，采用CamShift算法对手势进行跟踪，获取手势目标；对手势目标图像进行深度学习；将获取的待识别手势图像输入训练后的深度信念网络模型中，完成手势的识别分类。该方法对于手势的前期预处理相对较为繁琐，且依然需要对手势部位进行跟踪。

公开号为CN105654037A的专利文件公开了一种基于深度学习和特征图像的肌电信号手势识别方法，首先对采集手势肌电原始信号进行预处理；其次进行特征提取，通过不同尺寸和概率的采样窗口提取出包括时域、时频域的特征，并将这些特征转换成图像；然后将特征图像和其对应的动作标签一起输入到深度神经网络中进行训练，得到网络模型；最后将测试数据和训练得到的网络模型输入深度卷积神经网络中进行预测，得到每段动作所有图像的预测标签，将这些标签按照多数同意规则进行投票，票数最高者为该段动作类别。该申请是基于肌电信号来进行手势识别的，由于集群结构的复杂性，肌电信号的个体差异电极位置等影响，其分类难度很大。

发明内容

为了解决上述的技术问题，本发明提出了一种基于循环三维卷积神经网络的手势识别方法，使得手势识别的效果更为精确，能够对SKIG和ChaLearn2014数据集中的手势进行较为准确的识别，其精确度超过了以往的传统的方法。

本发明提供一种基于循环三维卷积神经网络的手势识别方法，包括数据预处理，还包括以下步骤：

步骤1：循环三维卷积神经网络分类器设计；

步骤2：所述循环三维卷积神经网络分类器预训练；

步骤3：所述循环三维卷积神经网络分类器训练；

步骤4：所述循环三维卷积神经网络分类器优化；

步骤5：输出分类标签，测试所述分类器的分类效果。

优选的是，所述循环三维卷积神经网络分类器由三维卷积神经网络和循环神经网络组成。

在上述任一方案中优选的是，所述数据预处理是指将获取到的数据处理成固定大小的且满足循环三维卷积神经网络输入层输入的规格需求。

在上述任一方案中优选的是，所述数据预处理的步骤如下：

步骤01：对输入的数据进行裁剪，随机裁剪的生成尺寸为A×A；