[发明专利]基于姿态识别和C3D网络的多人实时动作识别方法和系统有效
申请号: | 202110391846.2 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113191216B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 张冠华;张业岭;蒋林华;曾新华;庞成鑫;宋梁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/26;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 姿态 识别 c3d 网络 实时 动作 方法 系统 | ||
本发明涉及基于姿态识别和C3D网络的多人实时动作识别方法和系统,方法包括通过摄像头采集原始视频;采用OpenPose算法对原始视频进行人体姿态估计,生成人体姿态模型视频;对人体姿态模型视频中的动作起始帧进行判断;对初始数据的每一帧图片进行裁剪;将输入数据输入训练好的C3D网络模型,输出得到动作识别结果。与现有技术相比,本发明具有识别速度快,检测精度高等优点。
技术领域
本发明涉及动作识别领域,尤其是涉及一种基于姿态识别和C3D网络的多人实时动作识别方法和系统。
背景技术
姿态估计和动作识别一直以来都是计算机视觉领域的研究的重点,但是姿态估计和动作识别解决的是两个不同层次的问题。姿态估计完成的工作是根据视频或者图像信息,在画面中识别人的位置并且建立起人体的姿态模型;而动作识别所完成的工作是根据一段视频或者图像对视频中的人所做的动作进行一个判断,由于动作往往是一串连续的行为,所以对于动作的识别需要多个连续帧图像进行输入。现有的动作识别方法在识别速度、设备要求和识别精度方面都还有许多提升的空间。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于姿态识别和C3D网络的多人实时动作识别方法和系统,实现快速的、多人的、实时的动作识别系统。
本发明的目的可以通过以下技术方案来实现:
一种基于姿态识别和C3D网络的多人实时动作识别方法,其特征在于,包括以下步骤:
步骤1)通过摄像头采集原始视频;
步骤2)采用OpenPose算法对原始视频进行人体姿态估计,生成人体姿态模型视频;
步骤3)对人体姿态模型视频中的动作起始帧进行判断:
当连续
当连续
其中,a、b和c均为大于4的整数;
步骤4)对初始数据的每一帧图片进行裁剪,选取图片中人体部分的左右极值点之差和上下极值点之差中较大的一个差值作为边长组成正方形的边界框,并且将边界框扩大设定的像素得到最终边界框,通过最终边界框对图片进行裁剪,然后使用图像金字塔算法将边界框内的图片的尺寸调整为设定尺寸,所有裁剪后的图片组成的连续帧即为输入数据;
步骤5)将输入数据输入训练好的C3D网络模型,输出得到动作识别结果。
进一步地,所述步骤1)中,人体姿态模型视频以纯骨架结构的形式输出。
进一步地,所述步骤3)中,两两相邻帧关键点采用人体骨架的关节点。
进一步地,所述步骤5)中,C3D网络模型的训练包括以下步骤:
从数据库获取人体动作视频数据集,使用OpenPose算法对视频数据集进行人体姿态估计,生成人体姿态模型视频;
将人体姿态模型视频裁剪为160×160像素大小的视频块,在从中随机截取设定尺寸的b帧图像作为训练数据;
采用训练数据对C3D网络模型进行自适应训练。
进一步地,a的取值为5,b的取值为16,c的取值为20。
一种基于姿态识别和C3D网络的多人实时动作识别系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110391846.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品检测用揉捻装置
- 下一篇:一种高楼简易自救设备及其使用方法