[发明专利]一种人体姿态估计行为分析方法在审

专利信息
申请号: 201611016790.8 申请日: 2016-11-18
公开(公告)号: CN106780569A 公开(公告)日: 2017-05-31
发明(设计)人: 夏春秋 申请(专利权)人: 深圳市唯特视科技有限公司
主分类号: G06T7/292 分类号: G06T7/292;G06T7/285;G06T7/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 518057 广东省深圳市高新技术产业园*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 人体 姿态 估计 行为 分析 方法
【说明书】:

技术领域

发明涉及人体姿态估计领域,尤其是涉及了一种采用三维卷积神经网络技术的基于时空的人体姿态估计方法。

背景技术

信息时代科技发展突飞猛进,对计算机的视觉处理能力要求越来越高,在计算机视觉方向长期存在一个难题——从单目视频中进行人体姿态3D建模,这项任务的挑战包括姿态的巨大可变性,动作,外貌和背景,照明中的咬合和变化。近年来,在人体姿态估计领域已经研究出大量不同的实用方法,但大部分都只是应用于处理静态简单或深度图像,而且一般都是在图像平面尝试估计2D全身、上半身或单关节位置。而如果采用深度三维卷积神经网络技术,则可以预测身体关节精确定位,还可以应用于视频监控,人体动作识别,情绪识别,人机交互,视频编码,人体工程学,视频索引和检索等。

本发明引入基于2D视频帧流推断在三维空间维度下的人体关节位置问题,采用一种从视频捕获数据基于一个深度三维卷积神经网络模型估计人体姿态(即人体关节位置)的方法,仅利用一个2D单目相机捕获视频。这个方法的特征在于作为一个维度的时间能被编码为3D卷积运算的Z维(X维和Y维分别是图像的高和宽)。研究3D卷积网络对2D视频进行3D姿态估计的适用性。更根本地,本发明探究了在数据中将时间维度表示为一个卷积的额外维度的作用。

发明内容

针对仅从单目视频进行人体姿态3D建模的问题,本发明的目的在于提供一种基于时空的人体姿态估计行为分析方法,应用卷积神经网络技术到RGB视频上并将它扩展为三维卷积,在视频中编码时间维度作为卷积空间中的第三维,并且在3D坐标系中直接简化为人体关节位姿回归问题。

为解决上述问题,本发明提供一种采用三维卷积神经网络技术的基于时空的人体姿态估计方法,其主要内容包括:

(一)数据输入;

(二)预处理;

(三)深度三维卷积神经网络;

(四)后处理。

其中,一种基于时空的人体姿态估计行为分析方法,只采用一个单目视觉系统,将卷积神经网络方法扩展为三维卷积并应用到RGB视频上;在没有深度信息作为卷积神经网络的输入的情况下,基于2D视频帧流推断在三维空间维度下的人体关节位置;从单目视频中进行人体姿态三维建模的挑战在于姿态的巨大可变性,动作,外貌和背景,照明中的咬合和变化。

其中,一种基于时空的人体姿态估计行为分析方法,采用一种从视频捕获经由一个深度三维卷积网络估计人体姿态(即人体关节位置)的方法,利用一个单2D单目相机捕获视频;这个方法的特征在于作为一个维度的时间能被编码为3D卷积运算的Z维(X维和Y维分别是图像的高和宽)。

其中,所述的数据输入,采用了人体姿态数据集(有360万张3D人体姿势和对应图像),由4台经校准标准化的相机捕捉10个被试者表现15个不同动作(如吃,摆等)形成的50Hz高分辨率视频序列组成;这4台相机获取的视频彼此独立且不可联合;测试基于该数据集32个可获得的关节位置中的核心的17个;

对于每一个被试者提供以下数据:三维地面实况关节位置,人体的边界框。

进一步地,所述的测试,有三个被试者的地面实况数据被保留并用于服务器上的结果评估。

其中,所述的预处理,包括数据采样,数据调整,以及对比度归一化。

进一步地,所述的数据采样,数据调整和对比度归一化,其中数据采样是对原始数据样本进行二次抽样,得到一个由5副顺序分辨率为128×128的彩色图像组成的训练数据样本;数据调整地面实况关节位置被集中到骨盆骨位置(第一个关节);对比度归一化深度神经网络需要在训练时解释,全局对比度归一化(GCN)被应用于网络的输入数据(每个颜色通道)。

其中,所述的深度三维卷积神经网络,包括该卷积神经网络的架构以及训练得到模型;该架构涉及一个离散卷积运算的数学表达式(用*表示该运算),该表达式应用于三维数据(X,m×n×l维),使用三维翻转内核(K):

步长为1,没有补零;最佳的性能是有5个卷积层,内核层大小分别是3×5×5,2×5×5,1×5×5,1×3×3和1×3×3。最大池化是在第一、第二和第五卷积层后完成,且仅在内核空间的大为2×2的图像(而不是第三时间维度);最后的输出池层是扁平的大小为9680的一维向量,然后是完全连接到大小255的输出层(5帧×17个关节×3维)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611016790.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top