[发明专利]一种适用于文本查询的视频摘要生成方法在审

专利信息
申请号: 201710333950.X 申请日: 2017-05-12
公开(公告)号: CN106971010A 公开(公告)日: 2017-07-21
发明(设计)人: 夏春秋 申请(专利权)人: 深圳市唯特视科技有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06K9/00;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 518057 广东省深圳市高新技术产业园*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适用于 文本 查询 视频 摘要 生成 方法
【说明书】:

技术领域

发明涉及视频摘要领域,尤其是涉及了一种适用于文本查询的视频摘要生成方法。

背景技术

视频摘要技术建立在基于内容的多媒体分析技术基础上,多年以来一直是国内外多媒体研究的热点之一。随着对视频数据处理要求的不断提高和视频数据量的不断增多,人们需要为一长段视频建立一段摘要来快速浏览,以便更好地利用它。人们可以通过对视频内容的分析来减小视频存储,方便分类和索引,提高视频的使用效率、可用性和可访问性。视频摘要技术目前已经广泛地应用于大量使用视频监控的行业,如关键道路视频智能摘要、重点路段和收费闸口视频智能摘要、重点监舍或人员交接班视频智能摘要以及场馆、出入口视频智能摘要。然而,传统的视频摘要技术只能实现重要视频摘要的创建,不能实现文本查询功能,给查找和调取相关视频、跨视频搜索等带来了麻烦。

本发明提出了一种适用于文本查询的视频摘要生成方法,先给定训练目标,将视频帧和文本查询投影到相同的嵌入空间中,接着评估帧相关性,计算质量分数、多样性分数和代表性分数,再计算最终相关性,并对其进行建模,最后使用子模型优化的帧创建视频摘要。本发明运用子模型优化帧,创建多个目标的摘要,使子模型目标函数的线性组合最大化,创建出的摘要能更加准确地传达视频的主要信息,大大节省了人力和时间;同时在创建视频摘要的基础上,实现了文本查询功能,提高了实用性。

发明内容

针对不能实现文本查询功能的问题,本发明的目的在于提供一种适用于文本查询的视频摘要生成方法,先给定训练目标,将视频帧和文本查询投影到相同的嵌入空间中,接着评估帧相关性,计算质量分数、多样性分数和代表性分数,再计算最终相关性,并对其进行建模,最后使用子模型优化的帧创建视频摘要。

为解决上述问题,本发明提供一种适用于文本查询的视频摘要生成方法,其主要内容包括:

(一)给定训练目标;

(二)评估帧相关性;

(三)使用子模型优化的帧创建视频摘要。

其中,所述的给定训练目标,给定查询t的排名约束,相关帧v+的相关性分数高于不相关帧v-的相关性分数:

r(t,v+)>r(t,v-) (1)

可以使相关帧的相似度分数和质量分数高于不相关帧,从而开始训练模型;

在这种情况下,强加以上两个限制条件。

进一步地,所述的约束,为了强加这些约束并训练模型,将损失函数定义为:

其中,lp是成本函数,γ是间隔参数;使用Huber损失函数lp

其中,所述的评估帧相关性,将视频帧v和文本查询t投影到相同的嵌入空间中;将t和v的投影分别表示为t和v;一旦被训练,给定查询t的帧v的相关性可以通过一些相似性度量来估计;使用余弦相似性:

这可以评估关于查询的帧的语义相关性,也可以基于帧质量、构图等对先前的缩略图做出预测;计算最终相关性,即嵌入相似度和与查询无关的帧质量项的总和,并对其进行建模:

r(t,v)=s(t,v)+qv (5)

其中,qv是基于帧v的质量作为缩略图的查询分数。

进一步地,所述的文本和帧的表示,使用卷积神经网络来预测v和qv,通过循环神经网络获得t;为了共同学习这些网络的参数,用(t,v+,v-)三元组训练。

进一步地,所述的文字表示,首先将查询的每个单词投影到一个300个维度的语义空间中,使用长短期记忆(LSTM)模型将单个词的表示编码作为单个固定长度的嵌入,这样能够强调视觉上的信息词和处理短语。

进一步地,所述的图像表示,为了表示图像,利用预先训练的VGG-19网络的特征表征;用301个维度的线性层M代替softmax层;前300个维度作为嵌入v,而最后一个维度代表质量分数qv

其中,所述的使用子模型优化的帧创建视频摘要,使用子模型优化的帧创建多个目标的摘要;在这个帧中,摘要作为选择子集y*,其使子模型目标函数的线性组合最大化:

其中,表示视频的特征的所有可能解y和的集合;对于非负权重w,公式(6)是子模型,意味着可以使用贪婪算法进行贪婪评估和近似优化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710333950.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top