[发明专利]一种人体姿态估计方法、人体姿态估计装置及智能设备在审
申请号: | 202210764323.2 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115205968A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 蔡诗晗;葛利刚;付春江 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/44;G06V10/80;G06N3/04 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 肖遥 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 姿态 估计 方法 装置 智能 设备 | ||
1.一种人体姿态估计方法,其特征在于,包括:
将待处理人体图像输入已训练的姿态估计模型,所述姿态估计模型包括:特征金字塔网络及轻量级的骨干网络,其中,所述骨干网络用于提取所述待处理人体图像中多个层级的特征,所述特征金字塔网络用于融合所述骨干网络所提取的不同层级的特征;
根据所述骨干网络输出的最深层的特征得到第一估计结果,所述第一估计结果用于指示各个人体关键点在所述待处理人体图像中是否可见;
根据所述特征金字塔网络输出的热力图及偏移图得到第二估计结果,所述第二估计结果用于指示各个人体关键点在所述待处理人体图像中的坐标,所述热力图用于预测各个人体关键点的像素级位置,所述偏移图用于预测各个人体关键点的像素级位置在亚像素级的局部偏移量。
2.如权利要求1所述的人体姿态估计方法,其特征在于,所述骨干网络的指定的卷积层引入有注意力机制;针对每个指定的所述卷积层,所述注意力机制的过程包括:
计算所述卷积层的原始的输入特征在每个特征通道上的全局特征;
根据所有所述全局特征,计算各个所述特征通道的重标定系数;
根据各个所述重标定系数,分别在各个所述特征通道上对所述原始的输入特征进行重标定,得到所述卷积层的新的输入特征。
3.如权利要求2所述的人体姿态估计方法,其特征在于,所述计算所述卷积层的原始的输入特征在每个特征通道上的全局特征,包括:
针对每个所述特征通道,将所述特征通道所对应的滤波核与所述原始的输入特征相乘,得到所述特征通道的变换特征;
对所述特征通道的变换特征进行全局平均池化操作,得到所述原始的输入特征在所述特征通道的全局特征。
4.如权利要求2所述的人体姿态估计方法,其特征在于,所述根据所有所述全局特征,计算各个所述特征通道的重标定系数,包括:
对所有所述全局特征依次进行第一卷积处理、第一激活处理、第二卷积处理及第二激活处理,得到各个所述特征通道的重标定系数,所述第一卷积处理用于降低维度,所述第二卷积处理用于恢复维度,所述第一激活处理及所述第二激活处理用于学习不同所述特征通道之间的非线性关系。
5.如权利要求1所述的人体姿态估计方法,其特征在于,所述骨干网络所采用的激活函数为:
其中,x用于表示所述激活函数的输入,Activation(x)用于表示所述激活函数的输出。
6.如权利要求1所述的人体姿态估计方法,其特征在于,所述姿态估计模型在训练过程中针对所述热力图及所述偏移图所采用的损失函数为:
其中,P为所述姿态估计模型预测的人体关键点位置;G为真实的人体关键点位置;S为预设的人体关键点对集合;i,j∈S用于表示i及j分别为所述人体关键点对集合中的一个人体关键点对所对应的两个不同人体关键点。
7.如权利要求1所述的人体姿态估计方法,其特征在于,所述姿态估计模型的训练过程包括:
获取原始的样本图像;
对所述原始的样本图像进行数据增强处理,得到处理后的样本图像;
根据所述数据增强处理,更新所述原始的样本图像的标签数据,得到所述处理后的样本图像的标签数据;
根据所述处理后的样本图像及所述处理后的样本图像的标签数据对所述姿态估计模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210764323.2/1.html,转载请声明来源钻瓜专利网。