[发明专利]一种基于卷积神经网络模型的暴恐视频检测方法有效
申请号: | 201611128390.6 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106778590B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 纪荣嵘;林贤明;沈云航 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/02 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于卷积神经网络模型的暴恐视频检测方法,涉及计算机视觉和机器学习。包括以下步骤:1)深度神经网络模型的训练;2)在线暴恐视频检测。利用深度学习模型组合低层特征,形成更加抽象的高层表示属性或特征,以发现数据的分布式特征表示。通过该模型能够获取描述能力强的视频图像特征描述子。该特征描述子涵盖了视频图像从低到高各个层次的特征信息,从而大大提高了暴恐视频检测的准确率和召回率。通过少量样本来训练深度卷积网络来获得优秀的检测性能。对恐怖图片检测准确率达99%以上,召回率达98%以上。对于恐怖视频检测准确率达95%,召回率达99%。训练过程无需人工参与,自动根据少量样本生成海量数据。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 模型 视频 检测 方法 | ||
【主权项】:
一种基于卷积神经网络模型的暴恐视频检测方法,其特征在于包括以下步骤:1)深度神经网络模型的训练,具体方法如下:训练数据:正样本:每个类别一张清晰包含特定目标的暴恐图片或者视频帧,所述特定目标包括但不限于LOGO、旗帜;负样本:数百万张左右网络下载的正常图片;训练细节:训练数据每个类别有200万张图像,正负样本比率一比一;神经网络损失函数是交叉熵损失函数:L(θ)=-1N(Σi=1Nloghθ(xi)yi)]]>其中m为训练样本的数目,yi为第i个训练样本的标签,xi第i个训练样本的图像,hθ(xi)为第i个训练样本的网络输出结果,L(θ)为网络训练损失函数;训练数据预处理:所有训练图片大小调整为256×256,随机截取227×227大小的区域并减去所有样本均值作为输入;优化算法:在GPU上使用批量梯度下降算法和反向传播算法训练神经网络,每次迭代最小批量为256,初始学习速率为0.01,每隔10000次迭代学习速率减低10倍,训练过程冲量设为0.9,权重衰退设为0.0005,迭代训练直到训练损失收敛;2)在线暴恐视频检测,具体方法如下:在检测过程中,把待检测图像进行预处理,然后输入网络;网络前向传播,最终得到卷积网络的分类结果;为了定位目标在图像里的位置,把分类结果进行网络反向传播,最后得到图像上对应的梯度图,根据梯度图再用混合高斯模型获得具体目标的位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611128390.6/,转载请声明来源钻瓜专利网。