[发明专利]基于姿态识别和C3D网络的多人实时动作识别方法和系统有效
申请号: | 202110391846.2 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113191216B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 张冠华;张业岭;蒋林华;曾新华;庞成鑫;宋梁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/26;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 姿态 识别 c3d 网络 实时 动作 方法 系统 | ||
1.一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,包括以下步骤:
步骤1)通过摄像头采集原始视频;
步骤2)采用OpenPose算法对原始视频进行人体姿态估计,生成人体姿态模型视频;
步骤3)对人体姿态模型视频中的动作起始帧进行判断:
当连续a帧中的两两相邻帧关键点位置的变化程度都超过预先设定的阈值,则将其最后一帧判断为一个动态动作的动作起始帧,将之后的b帧图像作为初始数据;
当连续c帧中的两两相邻帧关键点位置的变化程度都小于等于预先设定的阈值,则判断当前处于一个静态的动作之中,将其最后一帧判断为一个静态动作的动作起始帧,将之后的b帧图像作为初始数据;
其中,a、b和c均为大于4的整数;
步骤4)对初始数据的每一帧图片进行裁剪,选取图片中人体部分的左右极值点之差和上下极值点之差中较大的一个差值作为边长组成正方形的边界框,并且将边界框扩大设定的像素得到最终边界框,通过最终边界框对图片进行裁剪,然后使用图像金字塔算法将边界框内的图片的尺寸调整为设定尺寸,所有裁剪后的图片组成的连续帧即为输入数据;
步骤5)将输入数据输入训练好的C3D网络模型,输出得到动作识别结果。
2.根据权利要求1所述的一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,所述步骤2)中,人体姿态模型视频以纯骨架结构的形式输出。
3.根据权利要求2所述的一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,所述步骤3)中,两两相邻帧关键点采用人体骨架的关节点。
4.根据权利要求1所述的一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,所述步骤5)中,C3D网络模型的训练包括以下步骤:
从数据库获取人体动作视频数据集,使用OpenPose算法对视频数据集进行人体姿态估计,生成人体姿态模型视频;
将人体姿态模型视频裁剪为160×160像素大小的视频块,在从中随机截取设定尺寸的b帧图像作为训练数据;
采用训练数据对C3D网络模型进行自适应训练。
5.根据权利要求1所述的一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,a的取值为5,b的取值为16,c的取值为20。
6.一种基于姿态识别和C3D网络的多人实时动作识别系统,其特征在于,包括:
采集模块,通过摄像头采集原始视频;
预处理模块,采用OpenPose算法对原始视频进行人体姿态估计,生成人体姿态模型视频;
判断模块,对人体姿态模型视频中的动作起始帧进行判断:当连续
裁剪模块,对初始数据的每一帧图片进行裁剪,选取图片中人体部分的左右极值点之差和上下极值点之差中较大的一个差值作为边长组成正方形的边界框,并且将边界框扩大设定的像素得到最终边界框,通过最终边界框对图片进行裁剪,然后使用图像金字塔算法将边界框内的图片的尺寸调整为设定尺寸,所有裁剪后的图片组成的连续帧即为输入数据;
识别模块,将输入数据输入训练好的C3D网络模型,输出得到动作识别结果。
7.根据权利要求6所述的一种基于姿态识别和C3D网络的多人实时动作识别系统,其特征在于,所述采集模块中,人体姿态模型视频以纯骨架结构的形式输出。
8.根据权利要求7所述的一种基于姿态识别和C3D网络的多人实时动作识别系统,其特征在于,所述判断模块中,两两相邻帧关键点采用人体骨架的关节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110391846.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品检测用揉捻装置
- 下一篇:一种高楼简易自救设备及其使用方法