[发明专利]最优网络结构化的轻量化人体姿态估计方法在审
申请号: | 202111320586.6 | 申请日: | 2021-11-09 |
公开(公告)号: | CN114155597A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 李安康;宋余庆;刘哲;刘毅 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/80;G06V10/82;G06V10/75;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 最优 网络 结构 量化 人体 姿态 估计 方法 | ||
本发明提供了一种最优网络结构化的轻量化人体姿态估计方法,构建整体网络结构,整体网络结构输入数据,进行网络最优搜索,获得最优的轻量化网络结构,将测试集输入到最优的轻量化网络结构中,输出人体姿态估计的热力图;整体网络结构为高低分辨率并行网络结构,可以充分提取人体姿态特征;最优的轻量化网络结构是通过选取最优网络结构化的候选模块、制定搜索方法以及选择性能评估策略获取的,候选模块之一的CPB模块是一个采用可分离卷积和通道参数削减的模块,具有网络参数量少、计算量小的同时能够保持较高的准确率。
技术领域
本发明属于计算机视觉的人体姿态估计技术领域,具体涉及一种最优网络结构化的轻量化人体姿态估计方法。
背景技术
随着计算机视觉和图像处理的日益发展,计算机视觉在图像目标分割、分类、检测和行为分类等领域大放异彩。人体姿态估计是其中重要的研究方向。
传统的人体姿态估计方法一般是基于图结构和形变部件模型,设计2D人体部件检测器,使用图模型建立各部件的连通性,并结合人体运动学的相关约束不断优化图结构模型来估计人体姿态。
与传统的机器视觉方法相比,深度学习可以省略数据的预处理,直接从原始数据中学习抽象的、本质的特征,从而代替人工提取特征。深度学习近年来被广泛地应用于姿态估计并取得了很好的精度。但是现有的利用深度学习进行姿态估计的模型的参数量和计算量都很庞大,经典的姿态估计深度学习模型通常只考虑如何提高模型的泛化性能,而忽略了显著的效率问题。而在实际生活应用中,需要在有限的计算环境下进行姿态实时估计,现有的深度学习模型中无法很好地实现在有限的计算环境下进行姿态实时估计。
发明内容
针对现有技术中存在不足,本发明提供了一种最优网络结构化的轻量化人体姿态估计方法,克服现有深度学习模型无法很好地实现在有限的计算环境下进行实时姿态估计的问题。
本发明是通过以下技术手段实现上述技术目的的。
最优网络结构化的轻量化人体姿态估计方法,具体为:
构建整体网络结构,所述整体网络结构包括五个模块,每个模块包括两个子模块;
整体网络结构输入数据,进行网络最优搜索,获得最优的轻量化网络结构;所述最优的轻量化网络结构是通过选取最优网络结构化的候选模块、制定搜索方法以及选择性能评估策略获取的;
将测试集输入到最优的轻量化网络结构中,输出人体姿态估计的热力图;
所述候选模块为CPB模块或MobileNet或ShuffleNet或Xception,所述CPB模块为一个采用可分离卷积和通道参数削减的模块。
进一步地,所述CPB模块为:将输入的特征图先通过1×1卷积进行通道缩减,接下来通过BN层和ReLU激活函数,接着采用3×3的深度可分离卷积,再使用1×1卷积,然后再通过BN层和ReLU激活函数,最后进行通道参数削减和融合。
进一步地,所述通道参数削减和融合具体为:输入的特征图输入短链接,通过1×1卷积削减α倍,最后将通道参数削减与短链接通道通过add操作融合。
更进一步地,在通道参数削减过程中,首先通过全局平均池化,获取全局通道特征,再通过两个全连接层,接着通过Sigmoid激活函数得到一个通道权重,然后进行Scale操作,Scale操作后的特征图再通过1x1卷积。
更进一步地,在Scale操作时,设置一个阈值γ,当通道权重小于阈值γ时,把通道权重设为零,若通道权重大于等于阈值γ时,通道权重保持Sigmoid激活函数得到的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111320586.6/2.html,转载请声明来源钻瓜专利网。