[发明专利]一种基于多流三维自适应图卷积的人体行为识别方法有效
申请号: | 202110799095.8 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113673560B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 田联房;余陆斌;杜启亮;向照夷 | 申请(专利权)人: | 华南理工大学;华南理工大学珠海现代产业创新研究院 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V40/20;G06V40/10;G06V10/82;G06N3/0464;G06F17/16 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 自适应 图卷 人体 行为 识别 方法 | ||
1.一种基于多流三维自适应图卷积的人体行为识别方法,其特征在于,包括以下步骤:
1)采集包含人体的视频,标注视频中人体的骨架信息和行为类别,构建训练集;
2)利用训练集构建自适应空间域注意力矩阵SAM和自适应时间域注意力矩阵TAM;
3)利用自适应空间域注意力矩阵SAM构建自适应空间域注意力图卷积模块ASAGCM,利用自适应时间域注意力矩阵TAM构建自适应时间域注意力图卷积模块ATAGCM;构建三维时空域图卷积模块GCN-3d;
自适应空间域注意力图卷积模块ASAGCM构建过程为:根据骨架的连接结构得到邻接矩阵,利用自适应系数平衡邻接矩阵和自适应空间域注意力矩阵SAM的权重后与输入特征图相乘,叠加通道后经过1×1空间域图卷积得到输出特征图;
自适应空间域注意力图卷积模块ASAGCM的实现用公式表示如下:
式中,fin、fout表示输入特征图和输出特征图,α为随着训练迭代更新的空间自适应系数,Ak是根据人体骨架连接关系得到的邻接矩阵,Ak的计算规则为:骨架中第n个节点和第m个节点若相连,则Ak中第n行第m列元素为1,否则为0,当n=m时,第n行第m列为1;是空间域1×1卷积的权重,k是子集序号,Kv是子集总数;
自适应时间域注意力图卷积模块ATAGCM的构建过程为:利用自适应系数平衡单位矩阵E和自适应时间域注意力矩阵TAM的权重后与输入特征图相乘,经过卷积核大小为Kt×1时间域图卷积得到输出特征图;
自适应时间域注意力图卷积模块ATAGCM的实现用公式表示如下:
fout=Wtfin(βE+(1-β)·TAM)
式中,β为随着训练迭代更新的空间自适应系数,E为单位矩阵,Wt是时间域Kt×1图卷积权重,Kt×1为卷积核大小;
三维时空域图卷积模块GCN-3d构建过程如下:构建三维邻接矩阵Aτ,与输入特征图相乘,经过卷积核大小为1×1三维时空域图卷积得到输出特征图;
三维时空域图卷积模块GCN-3d的实现用公式表示如下:
fout=WτfinAτ
式中,Aτ由A按行和列扩展τ次得到,其中,表示实数域,V为人体骨架关键点个数,Wτ为时空域图卷积权重;
4)利用自适应空间域注意力图卷积模块ASAGCM、自适应时间域注意力图卷积模块ATAGCM和三维时空域图卷积模块GCN-3d构建自适应图卷积层;
5)利用自适应图卷积层构建自适应图卷积网络;
6)利用自适应图卷积网络构建多流三维自适应图卷积网络;
7)利用训练集训练多流三维自适应图卷积网络;
8)利用训练后的多流三维自适应图卷积网络对视频中的人体进行行为识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;华南理工大学珠海现代产业创新研究院,未经华南理工大学;华南理工大学珠海现代产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110799095.8/1.html,转载请声明来源钻瓜专利网。