[发明专利]一种针对单目视频的三维人体姿态估计方法在审
申请号: | 202110648734.0 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113313731A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 姚莉;游文彦;杨俊宴;吴含前 | 申请(专利权)人: | 东南大学 |
主分类号: | G06T7/207 | 分类号: | G06T7/207;G06T5/00;G06N3/08;G06N3/04 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 目视 三维 人体 姿态 估计 方法 | ||
1.一种针对单目视频的三维人体姿态估计方法,其特征在于,所述方法包括以下步骤:
步骤1:对输入的单目人体运动视频,采用级联金字塔结构的二维姿态检测器进行二维关节坐标提取,并输出为二维关节序列;
步骤2:根据二维关节序列极值点与前后帧差异构建噪声阈值约束,通过阈值滤波器对二维关节序列进行平滑降噪;
步骤3:对输入若干帧二维关节序列进行升维卷积;
步骤4:构建时序扩张卷积模型,采用多层渐进结构,通过扩张因子实现对时间感知域的精准控制;
步骤5:采用切片方法在每层卷积结构中进行残差连接,在避免过拟合的同时保留主要特征并累加至卷积输出中;
步骤6:采用基于人体运动规律的帧间姿态连续性和提升模型底层感知能力的中间监督策略来构建联合损失函数;
步骤7:利用时序卷积模型输出的三维关节坐标序列重建与单目人体运动视频相对应的三维姿态结果。
2.根据权利要求1所述的针对单目视频的三维人体姿态估计方法,其特征在于,步骤2具体过程如下:
2.1噪声阈值约束:在滤波降噪的计算过程中,为了判定噪声点在序列中出现的位置,假设j表示所需预测的17个人体关节中的某个关节,Li表示在真实数据中该关节的坐标变换图出现极值点时与相邻的前后帧之间的距离,Kj为L1,L2,L3,…,Li的最大距离值,构建如下公式中的噪声阈值约束:
Kj=max(L1,L2,L3,…,Li)
当二维关节预测的关节点j坐标序列中出现极点时,若该极值点与前后两帧坐标点的距离皆大于Kj,则视该极值点为噪声点;
2.2二维关节滤波:假设X={x1,x2,x3,…,xi}代表一段帧数为i的二维姿态序列,xi为第i帧二维关节坐标,矩阵D由第i帧二维姿态减去前一帧二维姿态生成,矩阵R是第i帧二维姿态减去后一帧二维姿态生成,根据噪声阈值约束K可生成噪声点矩阵N,为了更新极大值噪声点和极小值噪声点,使用N生成对应极值矩阵Nex并取反得到Nex′,将均值矩阵与极值噪声点矩阵对应位的元素相乘累加到原矩阵中完成更新,则可以构建得到如下所示的二维关节滤波器来减少输出二维关节点序列中的噪点并增加平滑度:
其中,Xold为原有的的二维姿态序列,Xnew为平滑过后的二维姿态序列。
3.根据权利要求1所述的针对单目视频的三维人体姿态估计方法,其特征在于,所述的步骤4具体过程如下,输入层获取每个帧的J个关节的串联(x,y)坐标,并进行核大小为W,输出通道为C的时间卷积,然后采用是B个时序扩张卷积的块,B个块之间引入残差连接,每个块首先执行核大小为W且膨胀因子D=WB的一维卷积,然后再执行核大小为1的卷积,除最后一层的卷积之后是批量正则、ReLU和Dropout。
4.根据权利要求1所述的针对单目视频的三维人体姿态估计方法,其特征在于,所述的步骤5具体过程如下,对于每一层扩张卷积的单元,假定其输入数据维度为(3R,1024),则经过某一层的卷积后输出数据维度为(R,1024),为了将原始数据累加到输出中形成残差连接,采用切片函数来建立其中关联,设定区域为1×3的矩阵,对于矩阵内的元素以3为间隔进行提取,保证与输出维度匹配的同时保留了主要的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110648734.0/1.html,转载请声明来源钻瓜专利网。