[发明专利]一种基于多任务非自回归解码的人体骨架的动作预测方法在审

专利信息
申请号: 202010429280.3 申请日: 2020-05-20
公开(公告)号: CN111931549A 公开(公告)日: 2020-11-13
发明(设计)人: 李玺;李斌;田健;张仲非 申请(专利权)人: 浙江大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 傅朝栋;张法高
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 任务 回归 解码 人体 骨架 动作 预测 方法
【权利要求书】:

1.一种基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,包括以下步骤:

S1、获取用于训练的人体3D骨骼关键点数据集,并定义算法目标;

S2、建立图卷积编码器,对输入的人体3D骨架进行特征学习,得到输入骨架的特征;

S3、建立分类器,对输入的人体3D骨架输入进行行为识别;

S4、建立非自回归解码器,预测未来时刻人体3D骨架;

S5、使用共享的图卷积编码器和分类器,对预测的人体3D骨架再进行行为识别;

S6、使用S1~S5建立的联合学习框架进行未来时刻的人体动作预测。

2.如权利要求1所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S1中,所述的用于训练的人体3D骨骼关键点数据集,包括给定的人体骨架关键点序列其中表示第t帧中第n个节点的3D信息,该3D信息使用四元数表示,N为人体关节点总数,T1为给定序列帧数;还包括待预测的人体骨架关键点序列其中为待预测的第t帧中第n个节点的3D信息真值,T2为待预测序列帧数;

定义算法目标为:给定连续T1帧人体骨架序列作为输入,预测未来T2帧人体骨架序列的动作信息。

3.如权利要求2所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S2中,所述建立图卷积编码器,对输入的人体3D骨架进行特征学习,得到输入骨架的特征,具体包括:

S21、建立9层的图卷积编码网络,每一层加入LeakyReLU激活函数,且网络的每一层分别包含图卷积部分和时序卷积部分;图卷积部分所使用的图结构为数据集所定义的人体骨骼连接关系,时序卷积部分卷积核大小为9;利用该图卷积编码网络对给定的人体骨架输入提取其高层语义特征c,公式表示为:

c=fenc(X;θenc)

其中,fenc()为图卷积编码网络,θenc为编码网络参数,X为人体骨架输入序列。

4.如权利要求3所述的基于多任务非自回归解码的人体骨架的动作预测方法,其特征在于,步骤S3中,所述建立分类器,对输入的人体3D骨架输入进行行为识别,具体包括:

S31、建立3层的全连接网络作为行为识别分类网络,每一层加入LeakyReLU激活函数以及Dropout随机丢弃函数;在行为识别分类网络中,给定如S21所述的高层语义特征c,输出多类行为动作概率值p,公式表示为:

p=fcls(c;θcls)

其中,fcls()为行为识别分类网络,θcls为分类网络参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010429280.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top