[发明专利]一种基于多任务非自回归解码的人体骨架的动作预测方法在审
申请号: | 202010429280.3 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111931549A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 李玺;李斌;田健;张仲非 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 回归 解码 人体 骨架 动作 预测 方法 | ||
1.一种基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,包括以下步骤:
S1、获取用于训练的人体3D骨骼关键点数据集,并定义算法目标;
S2、建立图卷积编码器,对输入的人体3D骨架进行特征学习,得到输入骨架的特征;
S3、建立分类器,对输入的人体3D骨架输入进行行为识别;
S4、建立非自回归解码器,预测未来时刻人体3D骨架;
S5、使用共享的图卷积编码器和分类器,对预测的人体3D骨架再进行行为识别;
S6、使用S1~S5建立的联合学习框架进行未来时刻的人体动作预测。
2.如权利要求1所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S1中,所述的用于训练的人体3D骨骼关键点数据集,包括给定的人体骨架关键点序列其中表示第t帧中第n个节点的3D信息,该3D信息使用四元数表示,N为人体关节点总数,T1为给定序列帧数;还包括待预测的人体骨架关键点序列其中为待预测的第t帧中第n个节点的3D信息真值,T2为待预测序列帧数;
定义算法目标为:给定连续T1帧人体骨架序列作为输入,预测未来T2帧人体骨架序列的动作信息。
3.如权利要求2所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S2中,所述建立图卷积编码器,对输入的人体3D骨架进行特征学习,得到输入骨架的特征,具体包括:
S21、建立9层的图卷积编码网络,每一层加入LeakyReLU激活函数,且网络的每一层分别包含图卷积部分和时序卷积部分;图卷积部分所使用的图结构为数据集所定义的人体骨骼连接关系,时序卷积部分卷积核大小为9;利用该图卷积编码网络对给定的人体骨架输入提取其高层语义特征c,公式表示为:
c=fenc(X;θenc)
其中,fenc()为图卷积编码网络,θenc为编码网络参数,X为人体骨架输入序列。
4.如权利要求3所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S3中,所述建立分类器,对输入的人体3D骨架输入进行行为识别,具体包括:
S31、建立3层的全连接网络作为行为识别分类网络,每一层加入LeakyReLU激活函数以及Dropout随机丢弃函数;在行为识别分类网络中,给定如S21所述的高层语义特征c,输出多类行为动作概率值p,公式表示为:
p=fcls(c;θcls)
其中,fcls()为行为识别分类网络,θcls为分类网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010429280.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:水性环氧涂料的制备方法
- 下一篇:一种基于RTK技术的工程现场安全的监控方法