[发明专利]一种基于Transformer解码器的3D人体模型重建方法在审
| 申请号: | 202111543921.9 | 申请日: | 2021-12-16 |
| 公开(公告)号: | CN114463511A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 刘盛;邹思宇;姚璐;李超楠;陈胜勇 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06T17/20 | 分类号: | G06T17/20;G06T5/00;G06V10/46;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 忻明年 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 transformer 解码器 人体模型 重建 方法 | ||
1.一种基于Transformer解码器的3D人体模型重建方法,其特征在于,所述基于Transformer解码器的3D人体模型重建方法,包括:
对原始RGB图像进行预处理,获得包含目标人体的图像,并将其输入图像特征提取模块进行特征提取,获得图像网格特征;
将一个模板3D人体模型的顶点坐标输入到线性层,获得编码后的模板顶点特征;
将图像网格特征和模板顶点特征输入到顶点特征变换模块,融合后得到变换后的顶点特征;
将变换后的顶点特征通过上采样模块进行上采样,并通过逆向线性层将上采样后的顶点特征解码为最终预测的3D人体模型顶点坐标。
2.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述图像特征提取模块使用ResNet网络。
3.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述模板3D人体模型使用无性别的、标准姿态的SMPL人体模型。
4.根据权利要求3所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述模板3D人体模型是经过网格下采样算法处理后的低分辨率的模板3D人体模型。
5.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述顶点特征变换模块包括预设数量的Transformer解码器,首层Transformer解码器的输入为图像网格特征和模板顶点特征,其他Transformer解码器的输入为图像网格特征和上一层Transformer解码器输出的顶点特征。
6.根据权利要求5所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述Transformer解码器包括依次连接的自注意力层、交叉注意力层与前馈网络层,所述自注意力层、交叉注意力层与前馈网络层前还分别设置有各自的归一化层,所述自注意力层、交叉注意力层与前馈网络层每一层的输入都与本层的输出进行累加后输入到下一层;所述自注意力层的输入是模板顶点特征或上一层Transformer解码器输出的顶点特征,所述交叉注意力层的输入还包括图像网格特征。
7.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述上采样层由两个相同的MLP网络组成,每个MLP由两个线性层与其间的非线性激活层组成,分阶段地将低分辨率的顶点特征转化为高分辨率的顶点特征。
8.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述线性层和逆向线性层严格互逆,所述线性层表示为:
其中,表示模板3D人体模型的顶点坐标,z0表示模板顶点特征,W和b分别表示线性层的权重矩阵与偏置向量;
所述逆向线性层表示为:
V3D=(zV-b)W-1;
其中,V3D表示逆向线性层输出的3D人体模型顶点坐标,zV表示顶点特征变换模块输出的顶点特征,W-1表示W的广义右逆矩阵,W-1=WT(WWT)-1。
9.根据权利要求1所述的基于Transformer解码器的3D人体模型重建方法,其特征在于,所述图像特征提取模块、线性层、顶点特征变换模块、上采样模块和逆向线性层构成网络模型,所述网络模型在训练时,采用的损失函数如下:
其中,表示最终预测的3D人体模型顶点坐标损失,表示预测的3D人体关键点坐标损失,表示预测的2D人体关键点坐标损失;所述预测的3D人体关键点坐标和预测的2D人体关键点坐标由最终预测的3D人体模型顶点坐标计算得到,λ1、λ2、λ3为超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111543921.9/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





