[发明专利]一种基于深度学习的视频分类方法以及设备有效

专利信息
申请号: 201910133098.0 申请日: 2019-02-22
公开(公告)号: CN110032926B 公开(公告)日: 2021-05-11
发明(设计)人: 徐勇;李钊颖;罗闻 申请(专利权)人: 哈尔滨工业大学(深圳)
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 深圳市道勤知酷知识产权代理事务所(普通合伙) 44439 代理人: 何兵;饶盛添
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 视频 分类 方法 以及 设备
【权利要求书】:

1.一种基于深度学习的视频分类方法,其特征在于,包括:

获取视频的数据集及其类别标签;

将所述获取的视频均分N段,训练阶段每段视频随机选择M帧,将视频帧堆叠为多通道图像;

通过2D卷积神经网络,提取所述分为N段后的视频的视频空间加权特征;

通过3D卷积神经网络,提取所述分为N段后的视频的视频时间加权特征;

获得所述分为N段后的视频的视频多尺度特征;

融合所述N段视频特征计算预测得分,得到最终视频分类;

存储所述的训练好的视频分类模型,应用所述训练好的视频分类模型,对测试视频进行分类;

其中,所述将所述获取的视频均分N段,训练阶段每段视频随机选择M帧,将视频帧堆叠为多通道图像,包括:

将视频等分为N段,训练阶段每段视频随机选择M帧,测试阶段每段视频选择等距离M帧,将n=N×M帧图像堆叠,得到通道数为3的图像块,设置输入网络的视频帧分别记为X={x1,x2,…,xn},n表示输入网络的总帧数;

其中,所述通过2D卷积神经网络,提取所述分为N段后的视频的视频空间加权特征的步骤,包括:设置每帧图像提取到的某层空间特征为V={v1,v2,....,vn},空间提取的最后一层特征图为g,每一帧特征图与最后一层特征图点乘后做归一化处理得到每帧权重wi=softmax(vi·g),将权重与原始特征相乘得到加权空间特征V′={v1w1,v2w2,....,vnwn};

其中,所述通过3D卷积神经网络,提取所述分为N段后的视频的视频时间加权特征的步骤,包括:设置网络中某一层的特征图大小为H×W×C,通道数为C,计算时间权重,每层特征图乘上权重获得带有区分性的时间特征;

其中,所述融合所述N段视频特征计算预测得分,得到最终视频分类的步骤,包括:不同段视频对视频分类结果的重要性不同,设每段视频的重要性分别为w1,w2,…wN 视频的预测得分分别为C1,C2,.....,CN,权重乘上得分后累加得到最终融合分数,即由以下公式计算得到:

其中,权重设置倾向于中间段权重偏高,开始和结束段权重偏低,权重和为1;

其中,所述获得所述分为N段后的视频的视频多尺度特征,可以包括:

设置卷积神经网络最后一层特征图大小为H×W×C,直接利用大小为H×W的池化核获得1×1×C的特征送入全连接层计算预测分值将导致较大信息损失;

采用不同大小的池化核和池化方式包括取平均值或者取最大值的方式,获得多尺度的特征,然后拼接送入全连接层将避免信息损失。

2.如权利要求1所述的基于深度学习的视频分类方法,其特征在于,所述卷积神经网络,包括:

至少一个三维卷积层、至少一个三维池化层和至少一个全连接层。

3.如权利要求1所述的基于深度学习的视频分类方法,其特征在于,所述计算时间权重的步骤,包括:

将特征图利用卷积操作将通道数缩小r倍,即通道数变为C/r;

利用大小为H×W的平均池化将特征图大小变为1×1,即特征图变为1×1×C/r ;

在第三维度上利用ReLU函数做非线性变换;

同样利用卷积操作将通道数恢复至C,最后通过sigmoid函数获得归一化时间权重W={w1,w2,...,wC}。

4.如权利要求1所述的基于深度学习的视频分类方法,其特征在于,所述存储所述训练好的视频分类模型,应用所述训练好的视频分类模型,对测试视频进行分类,包括:

存储所述得到的训练好的视频分类模型,应用所述训练好的视频分类模型,对测试视频进行分类,通过训练好的卷积神经网络获得最后预测得分,选择分数最高类别作为分类结果。

5.一种基于深度学习的视频分类设备,其特征在于,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任一项所述的基于深度学习的视频分类方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910133098.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top