[发明专利]一种适用于文本查询的视频摘要生成方法在审
申请号: | 201710333950.X | 申请日: | 2017-05-12 |
公开(公告)号: | CN106971010A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 文本 查询 视频 摘要 生成 方法 | ||
技术领域
本发明涉及视频摘要领域,尤其是涉及了一种适用于文本查询的视频摘要生成方法。
背景技术
视频摘要技术建立在基于内容的多媒体分析技术基础上,多年以来一直是国内外多媒体研究的热点之一。随着对视频数据处理要求的不断提高和视频数据量的不断增多,人们需要为一长段视频建立一段摘要来快速浏览,以便更好地利用它。人们可以通过对视频内容的分析来减小视频存储,方便分类和索引,提高视频的使用效率、可用性和可访问性。视频摘要技术目前已经广泛地应用于大量使用视频监控的行业,如关键道路视频智能摘要、重点路段和收费闸口视频智能摘要、重点监舍或人员交接班视频智能摘要以及场馆、出入口视频智能摘要。然而,传统的视频摘要技术只能实现重要视频摘要的创建,不能实现文本查询功能,给查找和调取相关视频、跨视频搜索等带来了麻烦。
本发明提出了一种适用于文本查询的视频摘要生成方法,先给定训练目标,将视频帧和文本查询投影到相同的嵌入空间中,接着评估帧相关性,计算质量分数、多样性分数和代表性分数,再计算最终相关性,并对其进行建模,最后使用子模型优化的帧创建视频摘要。本发明运用子模型优化帧,创建多个目标的摘要,使子模型目标函数的线性组合最大化,创建出的摘要能更加准确地传达视频的主要信息,大大节省了人力和时间;同时在创建视频摘要的基础上,实现了文本查询功能,提高了实用性。
发明内容
针对不能实现文本查询功能的问题,本发明的目的在于提供一种适用于文本查询的视频摘要生成方法,先给定训练目标,将视频帧和文本查询投影到相同的嵌入空间中,接着评估帧相关性,计算质量分数、多样性分数和代表性分数,再计算最终相关性,并对其进行建模,最后使用子模型优化的帧创建视频摘要。
为解决上述问题,本发明提供一种适用于文本查询的视频摘要生成方法,其主要内容包括:
(一)给定训练目标;
(二)评估帧相关性;
(三)使用子模型优化的帧创建视频摘要。
其中,所述的给定训练目标,给定查询t的排名约束,相关帧v+的相关性分数高于不相关帧v-的相关性分数:
r(t,v+)>r(t,v-) (1)
可以使相关帧的相似度分数和质量分数高于不相关帧,从而开始训练模型;
在这种情况下,强加以上两个限制条件。
进一步地,所述的约束,为了强加这些约束并训练模型,将损失函数定义为:
其中,lp是成本函数,γ是间隔参数;使用Huber损失函数lp。
其中,所述的评估帧相关性,将视频帧v和文本查询t投影到相同的嵌入空间中;将t和v的投影分别表示为t和v;一旦被训练,给定查询t的帧v的相关性可以通过一些相似性度量来估计;使用余弦相似性:
这可以评估关于查询的帧的语义相关性,也可以基于帧质量、构图等对先前的缩略图做出预测;计算最终相关性,即嵌入相似度和与查询无关的帧质量项的总和,并对其进行建模:
r(t,v)=s(t,v)+qv (5)
其中,qv是基于帧v的质量作为缩略图的查询分数。
进一步地,所述的文本和帧的表示,使用卷积神经网络来预测v和qv,通过循环神经网络获得t;为了共同学习这些网络的参数,用(t,v+,v-)三元组训练。
进一步地,所述的文字表示,首先将查询的每个单词投影到一个300个维度的语义空间中,使用长短期记忆(LSTM)模型将单个词的表示编码作为单个固定长度的嵌入,这样能够强调视觉上的信息词和处理短语。
进一步地,所述的图像表示,为了表示图像,利用预先训练的VGG-19网络的特征表征;用301个维度的线性层M代替softmax层;前300个维度作为嵌入v,而最后一个维度代表质量分数qv。
其中,所述的使用子模型优化的帧创建视频摘要,使用子模型优化的帧创建多个目标的摘要;在这个帧中,摘要作为选择子集y*,其使子模型目标函数的线性组合最大化:
其中,表示视频的特征的所有可能解y和的集合;对于非负权重w,公式(6)是子模型,意味着可以使用贪婪算法进行贪婪评估和近似优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710333950.X/2.html,转载请声明来源钻瓜专利网。