[发明专利]基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质有效
| 申请号: | 202010557372.X | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN111782870B | 公开(公告)日: | 2021-11-30 |
| 发明(设计)人: | 曹达;曾雅文;荣辉桂;朱宁波;陈浩;秦拯 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/783;G06K9/00;G06K9/62;G06N20/00 |
| 代理公司: | 深圳市中原力和专利商标事务所(普通合伙) 44289 | 代理人: | 罗小辉 |
| 地址: | 410082 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 对抗性 视频 时刻 检索 方法 装置 计算机 设备 存储 介质 | ||
本发明提供一种基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质,输入完整视频和查询语句作为强化学习代理的环境信息;提取所述环境信息的查询语句特征、全局视频特征、位置特征和局部视频特征构成当前的视频时刻片段的状态;所述强化学习代理根据所述状态作出在所述时序边界移动的动作,获取执行所述动作的奖励以及根据所述奖励输出若干个更新的时序边界和局部视频特征,所述时序边界为更新后当前的视频时刻候选片段;通过贝叶斯个性化排序方法对所述时序边界和所述查询语句进行匹配,输出匹配分值,并将所述匹配分值作为奖励返回所述强化学习代理;通过对抗学习相互增强,直到收敛,得到对应所述查询语句的视频时刻片段。
【技术领域】
本发明涉及视频时刻检索领域,尤其涉及一种基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质。
【背景技术】
视频检索,旨在从一组可能的视频集合中检索与查询语句文本所描述语义最相关的视频。由于现代生活节奏的加快和信息的不断增加,迫切需要快速找到最符合人们实际需求的相关信息,特别是在视频领域,人们已经越来越更希望浏览一个与他们的兴趣相匹配的短视频时刻而不是整个视频。为了满足这一需求,出现了在语言查询下的视频时刻检索任务,其目的是定位与查询语句语义最相关视频时刻的开始点和结束点。
现有的视频时刻检索方法,如“通过语言查询的视频时刻定位”,其主要的步骤有:1、抽取视频片段特征和查询语句的特征;2、将视频片段特征和查询语句进行多模态处理,得到更丰富的语义信息;3、多层感知机分别预测视频和句子的匹配度分数和时间偏置。此方法是基于查询语句,从候选集合中选出最匹配的视频片段并增加时间偏置,其中候选集是通过滑动窗口策略切分生成的,然而为了满足定位的精确性,这种策略往往需要密集的切分,所以非常耗时,无法满足动态查询的需求,这要求视频片段的长度是变长的而不是固定的。另一方面,使用时间偏置虽然可以使定位不受限于窗口的大小,但是对偏置的预测不够稳定反而会损害到返回给查询的视频片段质量。
还有通过“阅读、观察和移动:视频中根据自然语言描述的时刻定位强化学习”,主要的步骤有:1、输入完整视频和查询语句成为强化学习代理的环境;2、抽取视频全局特征,视频片段特征,视频片段定位信息和查询文本的特征构成当前时刻的状态;3、强化学习代理根据当前状态输出对定位边界移动的动作,不断重复直至定位逐渐收敛。基于强化学习实现视频时刻定位的工作是引入强化学习的第一份工作,它能摆脱对于滑动窗口候选的依赖,实现更精准的定位。但是对代理奖励的设计却没有太多的探索。现有基于强化学习的方法借助每次定位边界移动前后的交并比(IoU)来计算,这是缺乏语义探索的并且固定的奖励值导致模型缓慢和不稳定的收敛。
总结来说,现有的两大类处理视频时刻检索的方法主要有两大类:基于滑动窗口候选集的排序方法和基于强化学习的定位方法以及基于滑动窗口候选集的排序方法是预先使用滑动窗口的策略将视频进行切分生成候选集,然后对候选集进行与查询文本的匹配,根据匹配度排序得到结果。显然这种方法产生了过多的片段,耗时较长,所以有学者引入强化学习把问题抽象成了一个连续性决策问题去直接定位(视频的开始帧和结束帧),尽管他们也取得了很好的效果,但对代理的奖励设计却没有太多的探索,这些方法往往不是稳定的。
基于滑动窗口候选集的排序方法和基于强化学习的定位方法各有利弊,排序方法擅长对众多视频时刻候选进行排序,但无法形成一定数量的合理候选集耗时过大,而定位方法则利用强化学习代理来控制来定位边界,但不能应用于大规模检索场景效率较低。
因此,有必要提供一种改进的视频时刻检索方法以解决上述问题。
【发明内容】
本发明克服了现有技术的不足,提供了一种基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质。
为达到上述目的,本发明解决其技术问题所采用的技术方案:提供一种基于强化学习的对抗性视频时刻检索方法,包括如下步骤:
S1:输入完整视频v和查询语句q作为强化学习代理的环境信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010557372.X/2.html,转载请声明来源钻瓜专利网。





