[发明专利]基于双模深度网络的视频事件检测与语义标注方法及装置有效
申请号: | 202110476192.3 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113255461B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 王赠凯;李攀攀 | 申请(专利权)人: | 嘉兴学院 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06F40/117;G06N3/0464;G06N3/08 |
代理公司: | 深圳国海智峰知识产权代理事务所(普通合伙) 44489 | 代理人: | 王庆海;刘军锋 |
地址: | 314000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于双模深度网络的视频事件检测与语义标注方法及装置,包括:对输入的体育视频进行解码,分别得到音频数据流和图像数据流;对于音频数据流,首先进行音频分帧处理,然后利用深度神经网络模型提取音频特征;对于图像数据流,进行镜头边界检测,根据镜头类型分析事件转换模式,确定感兴趣视频事件边界,利用深度神经网络提取感兴趣事件片段视觉特征;将音频特征和视觉特征进行融合分类,获取感兴趣事件检测和语义标注结果。本发明方法利用音视频双模特征和深度神经网络模型有效确定体育视频中的精彩事件边界,并对其进行分类识别实现事件语义标注,为基于内容的体育视频摘要和检索打下坚实基础。 | ||
搜索关键词: | 基于 双模 深度 网络 视频 事件 检测 语义 标注 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉兴学院,未经嘉兴学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110476192.3/,转载请声明来源钻瓜专利网。