[发明专利]基于人体拓扑结构对齐的多人姿态估计方法在审

专利信息
申请号: 202110009492.0 申请日: 2021-01-05
公开(公告)号: CN112801138A 公开(公告)日: 2021-05-14
发明(设计)人: 李浥东;郎丛妍;孙鑫雨;冯紫钰;赵治坤;汪敏 申请(专利权)人: 北京交通大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/00;G06F16/951;G06N3/02
代理公司: 北京市商泰律师事务所 11255 代理人: 黄晓军
地址: 100044 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 人体 拓扑 结构 对齐 姿态 估计 方法
【权利要求书】:

1.一种基于人体拓扑结构对齐的多人姿态估计方法,其特征在于,包括:

通过网络爬虫爬取没有袖子的人体图像,构建SZF数据集;

用MS-COCO和MPLL数据集为输入训练HRNet网络,得到XZZNet网络;利用HRNet网络对MS-COCO和MPLL数据集的图像样本进行学习得到人体关键点图像;

将SZF数据集输入到XZZNet网络中,XZZNet网络生成候选的没有袖子的人体姿态关键点;

对HRNet网络生成的人体关键点图和XZZNet生成的候选的人体关键点图进行图匹配,根据图匹配结果利用交叉熵损失函数微调XZZNet网络,得到优化的XZZNet网络;

将SZF数据集输入到优化的XZZNet网络中,生成SZF数据集中的图像对应的关键点检测图像,根据关键点检测图像得到图像中包含人体的各个关键点姿态信息。

2.根据权利要求1所述的方法,其特征在于,所述的通过网络爬虫爬取没有袖子的人体图像,构建SZF数据集,包括:

利用python的requests程序包实现网络爬虫,利用requests程序包调用抓取图片函数获取目标网页地址,循环遍历字典中存入的图片网址,用python代码将抓取的图像重命名后,对图像进行标注,标注完成,将图像和标注文件按照顺序一对一读入保存,构成SZF图像数据集。

3.根据权利要求1所述的方法,其特征在于,所述的用MS-COCO和MPLL数据集为输入训练HRNet网络,得到XZZNet网络;利用HRNet网络对MS-COCO和MPLL数据集的图像样本进行学习得到人体关键点图像,包括:

对MS-COCO和MPLL数据集中的原始图像进行翻转、裁剪和重塑,以变化后的图像为输入训练HRNet网络,得到鲁棒的XZZNet网络;利用HRNet网络对MS-COCO和MPLL数据集的图像样本进行学习得到人体关键点图,平均变化后的图像生成的热图,每个人体关键点的位置是通过调整最高热值的位置,并在从最高响应到第二高响应的方向上偏移四分之一来预测。

4.根据权利要求3所述的方法,其特征在于,利用MS-COCO和MPLL数据集为输入训练HRNet网络时,HRNet网络包含四个阶段,主体为四个并行的子网,各个子网的分辨率逐渐降低到一半,相应的宽度增加了一倍,在HRNet网络中引入了跨并行子网的交换单元,通过在并行的多分辨子网络上反复交换信息来进行多尺度的重复融合,使每个子网重复接受来自其他并行子网的信息。通过网络输出的高分辨率表示来估计关键点。

5.根据权利要求1所述的方法,其特征在于,所述的将SZF数据集输入到XZZNet网络中,XZZNet网络生成候选的没有袖子的人体姿态关键点,包括:

将之前构建的SZF数据集输入到XZZNet网络中,通过XZZNet网络中的CAFA模块和预训练网络利用Lfd函数学习域不变和细粒度的人跨域表示

其中,M,N表示源域与目标域的样本图像数量,Fs,i',Ft,j'表示第i个位置的Fs'和第j个位置的Ft'。φ是一个映射操作,它将域特征投影到一个内核希尔伯特空间H中;

将SZF数据集中的图像样本进行关键点的标记与注释,采用编码器-解码器架构进行姿态预测,用特征提取器生成相应的图像三元组特征和根据图像三元组特征和通过CAFA模块得到自适应的特征点Fs,Ft,将特征点Fs,Ft输入到姿态估计器中,预测出各自的关键点热图,生成候选的人体关键点图像。

6.根据权利要求1所述的方法,其特征在于,所述的对HRNet网络生成的人体关键点图和XZZNet生成的候选的人体关键点图进行图匹配,根据图匹配结果利用交叉熵损失函数调整XZZNet网络,得到优化的XZZNet网络,包括:

利用人体拓扑对齐对HRNet网络标注的人体关键点图像和XZZNet网络生成的候选标注的人体关键点图像进行图构建和图匹配操作,对域内一阶关键点进行对齐,根据交叉熵函数给出HRNet网络标注的人体关键点图像和XZZNet网络生成的候选标注的人体关键点图像对齐的损失函数,通过最小化所述损失函数反向微调XZZNet网络,利用反向传播BP算法不断更新XZZNet网络模型的参数,以训练XZZNet网络模型,使得XZZNet网络收敛,得到优化的XZZNet网络和矫正后的候选的人体关键点图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110009492.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top