[发明专利]基于时空强化学习的跨模态视频时刻定位方法在审

专利信息
申请号: 202010562550.8 申请日: 2020-06-18
公开(公告)号: CN111782871A 公开(公告)日: 2020-10-16
发明(设计)人: 曹达;曾雅文;荣辉桂;朱宁波;陈浩;秦拯 申请(专利权)人: 湖南大学
主分类号: G06F16/732 分类号: G06F16/732;G06F16/783;G06K9/00;G06N20/00
代理公司: 深圳市中原力和专利商标事务所(普通合伙) 44289 代理人: 罗小辉
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 时空 强化 学习 跨模态 视频 时刻 定位 方法
【权利要求书】:

1.一种基于时空强化学习的跨模态视频时刻定位方法,其特征在于,包括以下步骤:

S01、输入完整视频和查询语句,抽取视频特征和查询语句特征,构建强化学习环境;

S02、基于强化学习环境信息进行时序强化学习并定位视频的时序边界,所述环境信息包括视频全局特征、视频局部特征、定位边界和查询语句特征;

S03、基于所述时序强化学习的定位边界进行空间强化学习,在所述环境中处理空间信息并逐帧追踪相关场景,并用注意力机制过滤无关信息;

S04、根据空间强化学习更新时序强化学习的局部片段特征,使得所述空间强化学习和所述时序强化学习交替训练,直至收敛,得到对应查询语句的视频时刻片段。

2.根据权利要求1所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,所述步骤S02中,所述时序强化学习步骤包括:定义状态为set=[fe,lt,fot,fg],其中fe为查询语句特征、lt为位置特征、fot为所述位置特征相应的空间信息特征,fg为视频全局特征,t是当前时间步;定义时序强化学习智能体的动作Ae,所述动作Ae包括同时向前移动起点、同时向前移动终点、同时向后移动起点、同时向后移动终点、单独向前/向后移动起点和终点、单独向后移动起点和终点以及停止动作;设置所述时序强化学习智能体移动的初始位置为L0=[0.25*n,0.75*n],其中n是视频图像帧的总长度,动作每步的移动大小设置为n/2ze,其中ze为确定的超参数;定义智能体的最大搜索步数;所述时序强化学习智能体从环境中获取所述状态后,执行动作Ae,使用IoU评估后得到每步的奖励。

3.根据权利要求2所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,所述步骤S02中,使用IoU进行评估的公式为:

根据IoU的计算结果,定义所述时序强化学习智能体每步移动的奖励ret为:

其中,φ为惩罚系数,当IoUt大于IoUt-1,则当前动作将被视为正反馈,奖励为正,否则奖励为零或负,同时减去一个智能体对步数的惩罚。

4.根据权利要求1所述的基于时空强化的跨模态视频时刻定位方法,其特征在于,步骤S03中,所述空间强化学习使用目标跟踪框算法实现观察输入视频帧的空间信息,并输出连续图像帧的空间边界。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010562550.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top