[发明专利]基于CNN-BiGRU神经网络融合的手语识别方法有效
申请号: | 202110304616.8 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112883922B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 李桢旻;祝东疆;苏彦博;贺子珊;鲁杰;彭靖宇;杜高明;王晓蕾 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn bigru 神经网络 融合 手语 识别 方法 | ||
1.一种基于CNN-BiGRU神经网络融合的手语识别方法,其特征在于,包括以下步骤:
步骤1:利用深度摄像头设备获取由拇指位置坐标F1,食指位置坐标F2,中指位置坐标F3,无名指位置坐标F4,小拇指位置坐标F5,手掌中心位置PC,手掌稳定位置PS,手掌俯仰角Pitch,手掌偏航角Yaw,手掌滚动角Roll,手握球半径r,手掌宽度PW,掌心速度v所构成的多种手语数据;且每种手语数据设有相应的类别标签;由多种手语数据及其类别标签构成手语数据集;
步骤2:对手语数据集进行数据预处理;
步骤2.1、根据所述手语数据集计算得到手握球相对半径S、指尖掌心距离D、掌心相对速度V、绝对三维手掌位置标准差P、指间距离L并作为特征数据集;
利用式(1)得到手握球相对半径大小S:
利用式(2)、式(3)和式(4)分别得到x方向的掌心相对速度Vx、y方向的掌心相对速度Vy和z方向的掌心相对速度Vz:
式(2)-式(4)中,vk表示在k方向上的掌心速度;
步骤2.1.4、利用式(5)得到绝对三维手掌位置的标准差P:
P=PC-PS (5)
步骤2.2、采用零-均值规范化的方法,对所述特征数据集进行标准化处理,得到预处理后的特征数据集;
步骤2.3、对预处理后的特征数据集进行数据增强,得到增强后的特征数据集;
步骤3:将增强后的特征数据集划分为训练数据集、验证数据集和测试数据集;
步骤4:建立一维CNN和BiGRU融合的CNN-BiGRU深度神经网络模型;所述CNN-BiGRU深度神经网络模型包括:SpatialDropout层、一维CNN网络、BiGRU网络、全连接层;所述一维CNN网络由一维卷积层和一维最大池化层组成;所述BiGRU网络结构是由一个前向传播的GRU单元和一个后向传播的GRU单元组合而成;
步骤4.1、设置超参数,并初始化CNN-BiGRU深度神经网络模型的参数,从而得到当前网络模型;
步骤4.2、所述训练数据集输入所述当前网络模型中的SpatialDropout层中并经过一维CNN网络的卷积和最大池化操作,得到初次手语特征;所述初次手语特征经过BiGRU网络后,得到手语特征的时序信息并经过全连接层输出每种手语类别概率;
步骤4.3、利用优化算法将所述手语类别概率反向传播至当前网络模型,从而更新各层网络模型参数,并得到更新后的CNN-BiGRU深度神经网络模型;
步骤4.4、利用验证数据集验证更新后的CNN-BiGRU深度神经网络模型的准确率,从而判断更新后的CNN-BiGRU深度神经网络模型是否收敛,若收敛,则将更新后的CNN-BiGRU深度神经网络模型作为当前超参数设置下的最优手语分类模型,否则,将更新后的CNN-BiGRU深度神经网络模型作为当前网络模型,并返回步骤4.2;
步骤4.5、按照步骤4.1-步骤4.4的过程,得到不同超参数下的最优手语分类模型,并比较其在测试数据集上准确率,从而选择准确率最高的最优手语分类模型作为最终用于识别手语的模型。
2.根据权利要求1所述的基于CNN-BiGRU神经网络融合的手语识别方法,其特征在于,所述步骤2.1包括:
步骤2.1.1、利用式(6)得到指尖掌心距离D:
式(6)中,Fix表示第i个手指位置坐标中x方向的坐标值,Fiy表示第i个手指位置坐标中y方向的坐标值,Fiz表示第i个手指位置坐标中z方向的坐标值,PCx表示手掌中心位置坐标中x方向的坐标值,PCy表示手掌中心位置坐标中y方向的坐标值,PCz表示手掌中心位置坐标中z方向的坐标值,且i=1、2、3、4、5分别代表拇指、食指、中指、无名指、小拇指;
步骤2.1.2、利用式(7)得到指尖距离L:
式(7)中,Fjx表示第j个手指位置坐标中x方向的坐标值,Fjy表示第j个手指位置坐标中y方向的坐标值,Fjz表示第j个手指位置坐标中z方向的坐标值,j=1、2、3、4、5分别代表拇指、食指、中指、无名指、小拇指,且i≠j。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304616.8/1.html,转载请声明来源钻瓜专利网。
- 基于Smi2Vec的BiGRU药物毒性预测系统及预测方法
- 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置
- 一种基于ERNIE-BiGRU的中文文本分类方法
- 基于深度学习的预测化合物蛋白质亲和力新型编码方案、计算机设备、存储介质
- 一种基于BiGRU的智能电表计量模块故障预测与诊断方法
- 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种预测化合物蛋白质亲和力的新型深度学习模型、计算机设备、存储介质
- 基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种基于ATAE-BiGRU的文本方面情感分类方法及系统
- 一种基于自注意力机制和BiGRU的文本分类方法