[发明专利]基于时空图卷积网络的动作识别方法、装置和设备在审
申请号: | 202210504340.2 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114821799A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李清;李婷伟 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06K9/62;G06V10/46;G06V10/82;G06V10/40;G06V10/62;G06V10/77;G06V10/80;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张宁;臧建明 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时空 图卷 网络 动作 识别 方法 装置 设备 | ||
1.一种基于时空图卷积网络的动作识别方法,其特征在于,所述时空图卷积网络包括预设个数的时空图卷积网络层,部分时空图卷积网络层特征通道数不同,所述方法包括:
获取目标对象的动作数据,并根据所述动作数据生成拓扑结构图组,其中,所述拓扑结构图组中包括多个尺度的拓扑结构图,不同尺度的拓扑结构图具有不同大小的感受野,每一拓扑结构图由人体关节点集合和人体关节点连接关系矩阵构成,所述人体关节点集合中包括每一人体关节点的时序数据;
基于每一时空图卷积网络层,根据预设的卷积参数,对所述拓扑结构图组中每一拓扑结构图进行图卷积处理,输出与每一时空图卷积网络层对应的特征信息,其中,所述特征信息包括所述拓扑结构图组中每一拓扑结构图的特征矩阵,拓扑结构图的特征矩阵包括所述拓扑结构图中每一人体关节点的时间特征和空间特征;
根据各所述特征信息,确定所述动作数据的动作类别。
2.根据权利要求1所述的方法,其特征在于,所述拓扑结构图组包括全局尺度拓扑结构图、躯干尺度拓扑结构图以及核心尺度拓扑结构图;获取目标对象的动作数据,并根据所述动作数据生成拓扑结构图组,包括:
获取目标对象的动作数据,并识别提取所述动作数据中的人体骨架数据;
确定所述人体骨架数据中的人体关节点,并选取不同的人体关节点,构造全局尺度拓扑结构图、躯干尺度拓扑结构图以及核心尺度拓扑结构图。
3.根据权利要求2所述的方法,其特征在于,选取不同的人体关节点,构造全局尺度拓扑结构图、躯干尺度拓扑结构图以及核心尺度拓扑结构图,包括:
选取人体所有关节点构成人体关节点集合,并根据人体骨骼连接关系确定人体关节连接关系矩阵,确定全局尺度拓扑结构图;选取人体四肢和躯干中自由度大于预设自由度阈值的关节点构成人体关节点集合,并根据人体骨骼连接关系确定人体关节连接关系矩阵,确定所述躯干尺度拓扑结构图;选取人体末端的关节点构成人体关节点集合,并根据人体骨骼连接关系确定人体关节连接关系矩阵,确定所述核心尺度拓扑结构图。
4.根据权利要求2所述的方法,其特征在于,所述全局尺度拓扑结构图用于获取所述动作数据的细节特征,所述躯干尺度拓扑结构图用于获取所述动作数据的局部特征,所述核心尺度拓扑结构图用于获取所述动作数据的全局特征;基于每一时空图卷积网络层,根据预设的卷积参数,对所述拓扑结构图组中每一拓扑结构图进行图卷积处理,输出与每一时空图卷积网络层对应的特征信息,包括:
基于每一时空图卷积网络层,根据预设的卷积参数,对所述拓扑结构图组中每一拓扑结构图的每一人体关节点进行卷积处理和聚合处理,提取每一拓扑结构图中每一人体关节点的时间特征和空间特征,并对每一拓扑结构图中各人体关节点的时间特征和空间特征进行激活和归一化处理,确定每一拓扑结构图的特征矩阵;
对各拓扑结构图的特征矩阵进行特征融合处理,输出与每一时空图卷积网络层对应的特征信息,其中,所述特征融合处理包括特征拼接、特征相加以及集成学习方法中的一种或多种。
5.根据权利要求4所述的方法,其特征在于,基于每一时空图卷积网络层,根据预设的卷积参数,对所述拓扑结构图组中每一拓扑结构图的每一人体关节点进行卷积处理和聚合处理,提取每一拓扑结构图中每一人体关节点的时间特征和空间特征,包括:
根据每一拓扑结构图中的人体关节连接关系矩阵,获取所述拓扑结构图中的每一关节点的关联关节点集合,其中,所述关联关节点集合中的每一关节点都与对应的关节点具有空间关联关系;
根据预设卷积参数对每一关联关节点集合中的关节点进行卷积处理和聚合处理,获取对应关节点的时间特征和空间特征。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
获取所述目标对象的动作视频,对所述动作视频进行预处理,生成预设个数的动作帧;
根据所述预设个数的动作帧,确定所述目标对象的动作数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210504340.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:像素电路、像素驱动方法及显示装置
- 下一篇:一种集覆膜和裁切一体装置