[发明专利]一种基于深度卷积神经网络的人体运动计数方法在审
申请号: | 201810213000.8 | 申请日: | 2018-03-15 |
公开(公告)号: | CN110163038A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 司马华鹏 | 申请(专利权)人: | 南京硅基智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙) 11548 | 代理人: | 黄玉珏 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人体运动 卷积神经网络 分类模型 运动类型 摄像头 动作识别 动作视频 动作姿态 关键动作 视频序列 训练过程 训练样本 运算结果 分类器 视频帧 分类 捕获 剔除 校对 运算 录制 输出 锻炼 健身 表演 | ||
1.基于深度卷积神经网络的人体运动计数方法,其特征在于,依次进行如下步骤:
(1)定义5种基本人体运动类型,分别是:仰卧起坐、俯卧撑、深蹲、引体向上、高抬腿,分别定义为M1,M2,…M5,然后将上述5种运动的每一种分解成3个依次循环的关键动作姿态序列,共计15种关键动作姿态,分别定义为P1,P2,…P15,其中:运动M1的关键动作姿态序列为P1-P2-P3,运动M2的关键动作姿态序列为P4-P5-P6,运动M3的关键动作姿态序列为P7-P8-P9,运动M4的关键动作姿态序列为P10-P11-P12,运动M5的关键动作姿态序列为P13-P14-P15;
(2)令不同人表演M1~M5运动并且录制多个视频序列,从视频序列中提取符合上述P1~P15关键动作姿态的视频帧,定义为关键动作帧,然后再录制这5种运动之外的其他类型运动的多个视频序列;
(3)将步骤(2)录制的所有视频序列作为深度卷积神经网络分类算法的训练样本,定义包含如下16个类别的分类器:将步骤(2)中的15个关键动作姿态P1~P15分别作为一个类别,共计15个类别,分别定义为C1,C2,…C15,将不属于此5种运动的动作姿态归为第16个类别,定义为C16,然后进行基于深度卷积神经网络的动作识别训练过程,在训练完毕后输出分类模型;
(4)通过摄像头捕获人体运动的视频帧,输入到已训练好的分类模型进行分类运算,根据分类运算结果判断运动者所处的动作姿态,所述动作姿态属于C1~C16;
(5)如果判断出在该运动者的所有动作姿态中,属于C1~C15的一系列动作姿态符合M1~M5任意一种Mi所定义的关键动作姿态序列,i位于1~5,那么该运动者所进行的运动即为Mi,并且系统记录该运动Mi的计数加一。
2.根据权利要求1所述的基于深度卷积神经网络的人体运动计数方法,其特征在于:步骤(2)所述的提取过程利用PCA算法提取视频序列包含的动作姿态特征信息,利用K均值聚类算法将每一类运动的所有动作姿态分成三个聚类;在每个聚类中选择与聚类中心的距离小于该聚类所属类簇半径0.2倍的帧作为关键动作帧,加入训练样本,而聚类中不符合此条件的帧不加入训练样本。
3.根据权利要求2所述的基于深度卷积神经网络的人体运动计数方法,其特征在于:所述K均值聚类算法后,还包括对作为训练样本的关键动作帧的数据增强过程,所述数据增强的方法包括平移、旋转、尺度变换和色彩抖动。
4.根据权利要求1所述的基于深度卷积神经网络的人体运动计数方法,其特征在于:步骤(4)所述的分类运算过程还包括对关键动作帧的提取步骤;对关键动作帧的提取步骤利用PCA算法提取视频序列包含的动作姿态特征信息,利用K均值聚类算法将每一类运动的所有动作姿态分成三个聚类;在每个聚类中选择与聚类中心的距离小于该聚类所属类簇半径0.2倍的帧作为关键动作帧,参与所述分类运算过程,而聚类中不符合此条件的帧不参与分类运算过程。
5.根据权利要求1所述的基于深度卷积神经网络的人体运动计数方法,其特征在于:所使用的深度卷积神经网络与传统的AlexNet神经网络相比,减少两个全连接层,仅保留一个卷积层、一个池化层和一个全连接输出层。
6.根据权利要求1-3任意一项所述的基于深度卷积神经网络的人体运动计数方法,其特征在于,M1~M5这5种运动所对应的P1~P15关键动作姿态分别为:
M1-仰卧起坐所包含的关键动作姿态有:P1.平躺状态,P2.半起状态,P3.手肘触腿状态;
M2-俯卧撑所包含的关键动作姿态有:P4.俯卧撑准备阶段,P5.俯卧撑下降阶段,P6.俯卧撑完成状态;
M3-深蹲所包含的关键动作姿态有:P7.直立状态,P8.半蹲状态,P9.蹲下状态;
M4-引体向上所包含的关键动作姿态有:P10.下垂状态,P11.手臂弯曲状态,P12.头部高于单杠状态;
M5-高抬腿所包含的关键动作姿态有:P13.左脚平直状态,P14.左脚向下阶段,P15.右脚平直状态。
7.根据权利要求1所述的基于深度卷积神经网络的人体运动计数方法,其特征在于,步骤(5)的判断过程所包含的任意一个关键动作姿态序列,都至少包含3个视频帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京硅基智能科技有限公司,未经南京硅基智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810213000.8/1.html,转载请声明来源钻瓜专利网。