[发明专利]基于时空强化学习的跨模态视频时刻定位方法在审
| 申请号: | 202010562550.8 | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN111782871A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 曹达;曾雅文;荣辉桂;朱宁波;陈浩;秦拯 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/783;G06K9/00;G06N20/00 |
| 代理公司: | 深圳市中原力和专利商标事务所(普通合伙) 44289 | 代理人: | 罗小辉 |
| 地址: | 410082 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时空 强化 学习 跨模态 视频 时刻 定位 方法 | ||
1.一种基于时空强化学习的跨模态视频时刻定位方法,其特征在于,包括以下步骤:
S01、输入完整视频和查询语句,抽取视频特征和查询语句特征,构建强化学习环境;
S02、基于强化学习环境信息进行时序强化学习并定位视频的时序边界,所述环境信息包括视频全局特征、视频局部特征、定位边界和查询语句特征;
S03、基于所述时序强化学习的定位边界进行空间强化学习,在所述环境中处理空间信息并逐帧追踪相关场景,并用注意力机制过滤无关信息;
S04、根据空间强化学习更新时序强化学习的局部片段特征,使得所述空间强化学习和所述时序强化学习交替训练,直至收敛,得到对应查询语句的视频时刻片段。
2.根据权利要求1所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,所述步骤S02中,所述时序强化学习步骤包括:定义状态为set=[fe,lt,fot,fg],其中fe为查询语句特征、lt为位置特征、fot为所述位置特征相应的空间信息特征,fg为视频全局特征,t是当前时间步;定义时序强化学习智能体的动作Ae,所述动作Ae包括同时向前移动起点、同时向前移动终点、同时向后移动起点、同时向后移动终点、单独向前/向后移动起点和终点、单独向后移动起点和终点以及停止动作;设置所述时序强化学习智能体移动的初始位置为L0=[0.25*n,0.75*n],其中n是视频图像帧的总长度,动作每步的移动大小设置为n/2ze,其中ze为确定的超参数;定义智能体的最大搜索步数;所述时序强化学习智能体从环境中获取所述状态后,执行动作Ae,使用IoU评估后得到每步的奖励。
3.根据权利要求2所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,所述步骤S02中,使用IoU进行评估的公式为:
根据IoU的计算结果,定义所述时序强化学习智能体每步移动的奖励ret为:
其中,φ为惩罚系数,当IoUt大于IoUt-1,则当前动作将被视为正反馈,奖励为正,否则奖励为零或负,同时减去一个智能体对步数的惩罚。
4.根据权利要求1所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,步骤S03中,所述空间强化学习使用目标跟踪框算法实现观察输入视频帧的空间信息,并输出连续图像帧的空间边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010562550.8/1.html,转载请声明来源钻瓜专利网。





