[发明专利]一种基于强化学习的视频序列二维姿态估计方法有效
申请号: | 202110480110.2 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113205043B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 陈军;马宪政;刘涛榕;常路 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/40;G06V10/774;G06K9/62;G06N20/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 视频 序列 二维 姿态 估计 方法 | ||
1.一种基于强化学习的视频序列二维姿态估计方法,其特征在于,包括:
S1:构建运动转换网络学习框架,运动转换网络学习框架包括强化学习智能体、姿态估计器和运动转换器,其中,强化学习智能体用于主动选择出一个未标注帧和一个已标注帧并组成帧对,姿态估计器用于分别对未标注帧和已标注帧进行姿态估计;运动转换器用于根据未标注帧、标注帧、预训练的姿态估计器的对未标注帧的姿态估计结果、已标注帧的姿态估计结果进行运动转换,学习视频中的时序信息以及运动模式;
S2:在运动转换网络学习框架中将组成的帧对对姿态估计器和运动转换器进行联合训练,训练过程中,计算损失并进行反向传播,对运动转换器和姿态估计器进行更新,得到更新后的运动转换器和更新后的姿态估计器,其中,更新后的运动转换器将学习到的视频中的时序信息以及运动模式传递给更新后的姿态估计器;
S3:基于更新后的姿态估计器对视频序列进行二维姿态估计;
运动转换器包括运动转换生成器和判别器,步骤S1中运动转换的过程包括:
首次运动转换,通过运动转换生成器根据未标注帧和标注帧的真实姿态标签生成新标注帧,通过判别器指导运动转换生成器生成更真实的标注帧,并判断新标注帧与原标注帧在姿态上的一致性;
再次运动转换,通过运动转换生成器根据标注帧和未标注帧的姿态标签生成新未标注帧,通过判别器指导运动转换生成器生成更真实的未标注帧,并判断新未标注帧与原未标注帧在姿态上的一致性。
2.如权利要求1所述的二维姿态估计方法,其特征在于,步骤S1中强化学习智能体选择一个未标注帧和一个标注帧并组成帧对,包括:
强化学习智能体根据当前视频序列构建整体状态,整体状态包括三部分特征,分别为当前姿态估计器的性能、当前视频序列的全局信息、已有的标注帧与未标注帧的帧号对;
强化学习智能体从整体状态中获取当前状态,并根据获取的当前状态输出动作,输出动作表示从无标签视频帧的候选池中选择一个未标注帧与给定的标注帧进行配对,组成帧对。
3.如权利要求2所述的二维姿态估计方法,其特征在于,S2具体包括:
将强化学习智能体选择出的未标注帧和标注帧输入姿态估计器;
姿态估计器对未标注帧和标注帧进行姿态估计,得到未标注帧的姿态和标注帧的姿态,其中,标注帧还包括真实姿态;
运动转换生成器将未标注帧和标注帧的真实姿态标签作为输入,重建标注帧,得到新标注帧,姿态估计器估计新标注帧的姿态;
运动转换生成器将标注帧和未标注帧的姿态标签作为输入,重建未标注帧,得到新未标注帧,姿态估计器估计新未标注帧的姿态;
判别器判断新标注帧的真假、新未标注帧的真假,并判断新标注帧与原标注帧在姿态上的一致性、新未标注帧与原未标注帧在姿态上的一致性;
根据标注帧预测的姿态标签与真实姿态标签之间的误差、重建的视频帧与目标姿态之间的误差以及姿态估计器估计的姿态误差,构建损失函数;
通过损失函数和有监督损失对运动转换器和姿态估计器进行更新,得到更新后的运动转换器和更新后的姿态估计器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110480110.2/1.html,转载请声明来源钻瓜专利网。