[发明专利]一种基于显著信息的视频分类方法有效
申请号: | 201910407378.6 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110263638B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 刘琚;刘晓玺;顾凌晨 | 申请(专利权)人: | 山东大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/46;G06V10/54;G06V10/52;G06V10/80;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/047;G06N3/084 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李健康 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 为了解决3D视频分类网络的特征包含较多冗余信息的问题,本发明提出了一种基于显著信息的视频分类方法。主要思想在于组合不同大小卷积核,搭建多个显著信息提取模块,获得多尺度、具有代表性的显著信息;此外,为了解决网络中传统池化单元对视频信息造成的大量损失,设计了一种卷积池化相结合的双路池化单元对显著信息提取模块的输出进行针对性池化操作;最终,为了加快网络的收敛速度,优化网络收敛路径,实现端到端的训练,本发明设计了一种全新的损失函数,最终实现更精准的视频分类。该方法可以产生具有精确表征能力的视频特征,其在动作识别和场景识别场景中进行了实验,均达到优异的效果,充分证明方法具有较强的泛化能力。 | ||
搜索关键词: | 一种 基于 显著 信息 视频 分类 方法 | ||
【主权项】:
1.一种基于显著信息的短视频分类方法,该方法基于伪3D残差网络P3D,其特征在于该方法包括以下步骤:步骤1:随机提取视频中的若干连续帧,送入伪3D残差网络P3D;步骤2:所述连续帧依次经过P3D的前三个残差块,得到输出视频特征;步骤3:所述前三个残差块的输出分别送入不同的三个显著信息提取模块;步骤4:搭建卷积池化相结合的双路池化模块,对每个显著信息提取模块的输出进行针对性池化;步骤5:对三个显著信息提取模块的输出进行多尺度融合,得到唯一的显著特征图;步骤6:将所述唯一的显著特征图与P3D第四个残差块的输出按位相乘;步骤7:将步骤8输出的视频特征送入全连接层;步骤8:得到视频分类的预测结果,利用损失函数计算预测结果与标签的误差;步骤9:基于损失函数进行网络优化,通过梯度下降与反向传播不断迭代以更新网络参数,使网络达到最优性能;步骤8中的所述损失函数为:
其中,J1是多分类交叉熵损失函数,J2是显著性部分损失函数,J3是池化部分损失函数,J4是权重衰减部分,
代表M组样本数据,其中Xi为视频样本,li为视频样本标签,yi代表网络输出的预测值,t为所属类别,其取值范围为t∈[0,C‑1],C为视频类别个数,Θ代表模型参数,Sfinal(·)为显著特征图经多尺度融合后的唯一显著特征图,双路池化模块第二支路的输出上采样后得到Pup(Xi;Θ),S(Xi;Θ)为显著特征提取模块的输出,λ,μ,γ均为权衡因子。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910407378.6/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置