[发明专利]一种基于强化学习的视频序列二维姿态估计方法有效

申请号：	202110480110.2	申请日：	2021-04-30
公开（公告）号：	CN113205043B	公开（公告）日：	2022-06-07
发明（设计）人：	陈军;马宪政;刘涛榕;常路	申请（专利权）人：	武汉大学
主分类号：	G06V40/10	分类号：	G06V40/10;G06V20/40;G06V10/774;G06K9/62;G06N20/00
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	罗飞
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习视频序列二维姿态估计方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于强化学习的视频序列二维姿态估计方法，其特征在于，包括：

S1：构建运动转换网络学习框架，运动转换网络学习框架包括强化学习智能体、姿态估计器和运动转换器，其中，强化学习智能体用于主动选择出一个未标注帧和一个已标注帧并组成帧对，姿态估计器用于分别对未标注帧和已标注帧进行姿态估计；运动转换器用于根据未标注帧、标注帧、预训练的姿态估计器的对未标注帧的姿态估计结果、已标注帧的姿态估计结果进行运动转换，学习视频中的时序信息以及运动模式；

S2：在运动转换网络学习框架中将组成的帧对对姿态估计器和运动转换器进行联合训练，训练过程中，计算损失并进行反向传播，对运动转换器和姿态估计器进行更新，得到更新后的运动转换器和更新后的姿态估计器，其中，更新后的运动转换器将学习到的视频中的时序信息以及运动模式传递给更新后的姿态估计器；

S3：基于更新后的姿态估计器对视频序列进行二维姿态估计；

运动转换器包括运动转换生成器和判别器，步骤S1中运动转换的过程包括：

首次运动转换，通过运动转换生成器根据未标注帧和标注帧的真实姿态标签生成新标注帧，通过判别器指导运动转换生成器生成更真实的标注帧，并判断新标注帧与原标注帧在姿态上的一致性；

再次运动转换，通过运动转换生成器根据标注帧和未标注帧的姿态标签生成新未标注帧，通过判别器指导运动转换生成器生成更真实的未标注帧，并判断新未标注帧与原未标注帧在姿态上的一致性。

2.如权利要求1所述的二维姿态估计方法，其特征在于，步骤S1中强化学习智能体选择一个未标注帧和一个标注帧并组成帧对，包括：

强化学习智能体根据当前视频序列构建整体状态，整体状态包括三部分特征，分别为当前姿态估计器的性能、当前视频序列的全局信息、已有的标注帧与未标注帧的帧号对；

强化学习智能体从整体状态中获取当前状态，并根据获取的当前状态输出动作，输出动作表示从无标签视频帧的候选池中选择一个未标注帧与给定的标注帧进行配对，组成帧对。

3.如权利要求2所述的二维姿态估计方法，其特征在于，S2具体包括：

将强化学习智能体选择出的未标注帧和标注帧输入姿态估计器；

姿态估计器对未标注帧和标注帧进行姿态估计，得到未标注帧的姿态和标注帧的姿态，其中，标注帧还包括真实姿态；

运动转换生成器将未标注帧和标注帧的真实姿态标签作为输入，重建标注帧，得到新标注帧，姿态估计器估计新标注帧的姿态；