[发明专利]一种视频描述方法及装置有效

申请号：	202110476064.9	申请日：	2021-04-29
公开（公告）号：	CN113191263B	公开（公告）日：	2022-05-13
发明（设计）人：	蔡晓东;王湘晴	申请（专利权）人：	桂林电子科技大学
主分类号：	G06V20/40	分类号：	G06V20/40;G06V10/74;G06V10/82;G06F16/71;G06F16/783;G06K9/62;G06N3/04
代理公司：	北京轻创知识产权代理有限公司 11212	代理人：	尉保芳
地址：	541004 广西***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频描述方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种视频描述方法及装置，方法包括：导入待测视频，对所述待测视频进行时序语义特征分割，得到多个镜头数据；通过预设视频描述模型分别对各个所述镜头数据进行转换分析，得到与各个所述镜头数据对应的镜头描述信息；对多个所述镜头描述信息进行语句融合分析，得到视频描述信息。本发明能够确保了视频里信息的不丢失，且不会产生镜头语义冗余，能对每个镜头都进行描述，有助于提高在线视频的索引和搜索质量，并提高了视频检索的效率和精确性，拥有了更强的鲁棒性，且有可能使视力受损者受益。

技术领域

本发明主要涉及视频处理技术领域，具体涉及一种视频描述方法及装置。

背景技术

视频描述任务对计算机视觉和机器学习研究提出了重要的挑战，它有多种实际应用，例如，每分钟有100个小时的视频上传到YouTube。然而，如果一个视频标记不当，它的效用就会大大降低。现有技术对视频进行描述的方法是间断地提取一些帧来进行描述，这样的方法会丢失掉一些信息，使得描述不准确，对视频的检索也就不能准确。

发明内容

本发明所要解决的技术问题是针对现有技术的不足，提供一种视频描述方法及装置。

本发明解决上述技术问题的技术方案如下：一种视频描述方法，包括如下步骤：

导入待测视频，对所述待测视频进行时序语义特征分割，得到多个镜头数据；

通过预设视频描述模型分别对各个所述镜头数据进行转换分析，得到与各个所述镜头数据对应的镜头描述信息；

对多个所述镜头描述信息进行语句融合分析，得到视频描述信息。

本发明解决上述技术问题的另一技术方案如下：一种视频描述装置，包括：

特征分割模块，用于导入待测视频，对所述待测视频进行时序语义特征分割，得到多个镜头数据；

转换分析模块，用于通过预设视频描述模型分别对各个所述镜头数据进行转换分析，得到与各个所述镜头数据对应的镜头描述信息；

视频描述信息获得模块，用于对多个所述镜头描述信息进行语句融合分析，得到视频描述信息。

本发明的有益效果是：通过对待测视频的时序语义特征分割得到多个镜头数据，通过预设视频描述模型分别对各个镜头数据的转换分析得到与各个镜头数据对应的镜头描述信息，能够确保了视频里信息的不丢失，且不会产生镜头语义冗余，能对每个镜头都进行描述，有助于提高在线视频的索引和搜索质量，对多个镜头描述信息的语句融合分析得到视频描述信息，提高了视频检索的效率和精确性，拥有了更强的鲁棒性，且有可能使视力受损者受益。

附图说明

图1为本发明实施例提供的视频描述方法的流程示意图；

图2为本发明实施例提供的视频描述方法的示意图；

图3为本发明实施例提供的视频描述装置的模块框图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

图1为本发明实施例提供的视频描述方法的流程示意图。

如图1和2所示，一种视频描述方法，包括如下步骤：

导入待测视频，对所述待测视频进行时序语义特征分割，得到多个镜头数据；

通过预设视频描述模型分别对各个所述镜头数据进行转换分析，得到与各个所述镜头数据对应的镜头描述信息；

对多个所述镜头描述信息进行语句融合分析，得到视频描述信息。

应理解地，所述时序语义特征分割通俗来说叫镜头分割。