[发明专利]一种视频描述方法及装置有效
申请号: | 202110476064.9 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113191263B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 蔡晓东;王湘晴 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/74;G06V10/82;G06F16/71;G06F16/783;G06K9/62;G06N3/04 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 描述 方法 装置 | ||
本发明提供一种视频描述方法及装置,方法包括:导入待测视频,对所述待测视频进行时序语义特征分割,得到多个镜头数据;通过预设视频描述模型分别对各个所述镜头数据进行转换分析,得到与各个所述镜头数据对应的镜头描述信息;对多个所述镜头描述信息进行语句融合分析,得到视频描述信息。本发明能够确保了视频里信息的不丢失,且不会产生镜头语义冗余,能对每个镜头都进行描述,有助于提高在线视频的索引和搜索质量,并提高了视频检索的效率和精确性,拥有了更强的鲁棒性,且有可能使视力受损者受益。
技术领域
本发明主要涉及视频处理技术领域,具体涉及一种视频描述方法及装置。
背景技术
视频描述任务对计算机视觉和机器学习研究提出了重要的挑战,它有多种实际应用,例如,每分钟有100个小时的视频上传到YouTube。然而,如果一个视频标记不当,它的效用就会大大降低。现有技术对视频进行描述的方法是间断地提取一些帧来进行描述,这样的方法会丢失掉一些信息,使得描述不准确,对视频的检索也就不能准确。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种视频描述方法及装置。
本发明解决上述技术问题的技术方案如下:一种视频描述方法,包括如下步骤:
导入待测视频,对所述待测视频进行时序语义特征分割,得到多个镜头数据;
通过预设视频描述模型分别对各个所述镜头数据进行转换分析,得到与各个所述镜头数据对应的镜头描述信息;
对多个所述镜头描述信息进行语句融合分析,得到视频描述信息。
本发明解决上述技术问题的另一技术方案如下:一种视频描述装置,包括:
特征分割模块,用于导入待测视频,对所述待测视频进行时序语义特征分割,得到多个镜头数据;
转换分析模块,用于通过预设视频描述模型分别对各个所述镜头数据进行转换分析,得到与各个所述镜头数据对应的镜头描述信息;
视频描述信息获得模块,用于对多个所述镜头描述信息进行语句融合分析,得到视频描述信息。
本发明的有益效果是:通过对待测视频的时序语义特征分割得到多个镜头数据,通过预设视频描述模型分别对各个镜头数据的转换分析得到与各个镜头数据对应的镜头描述信息,能够确保了视频里信息的不丢失,且不会产生镜头语义冗余,能对每个镜头都进行描述,有助于提高在线视频的索引和搜索质量,对多个镜头描述信息的语句融合分析得到视频描述信息,提高了视频检索的效率和精确性,拥有了更强的鲁棒性,且有可能使视力受损者受益。
附图说明
图1为本发明实施例提供的视频描述方法的流程示意图;
图2为本发明实施例提供的视频描述方法的示意图;
图3为本发明实施例提供的视频描述装置的模块框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的视频描述方法的流程示意图。
如图1和2所示,一种视频描述方法,包括如下步骤:
导入待测视频,对所述待测视频进行时序语义特征分割,得到多个镜头数据;
通过预设视频描述模型分别对各个所述镜头数据进行转换分析,得到与各个所述镜头数据对应的镜头描述信息;
对多个所述镜头描述信息进行语句融合分析,得到视频描述信息。
应理解地,所述时序语义特征分割通俗来说叫镜头分割。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110476064.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频描述数据处理方法、装置及存储介质
- 下一篇:一种USB接头测试连接器