[发明专利]一种基于深度学习的视频异常行为检测方法在审
申请号: | 201711145995.0 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107944373A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 陈华华;雷丽莹;郭春生 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于深度学习的视频异常行为检测方法。本发明方法首先进行预处理,然后进行训练阶段和测试阶段。训练阶段首先得到三个训练样本集,将其分别送到Alexnet中,得到三组特征数据,赋予标签值,将三组特征数据及其相应标签数据作为三个一类支持向量机。测试阶段首先得到三个测试样本,将其分别送入Alexnet中,得到三组特征数据,设定初始标签值,将三组特征数据及其相应标签值送到三个一类支持向量机中进行检测,输出三个测试样本的分类标签值,如果存在‑1,表示该帧图像的人群行为异常。本发明用深度学习的方法从大数据中自动学习特征,可更全面的表达输入,克服了手工提取特征的不足,从而提高异常行为的检测率。 | ||
搜索关键词: | 一种 基于 深度 学习 视频 异常 行为 检测 方法 | ||
【主权项】:
一种基于深度学习的视频异常行为检测方法,其特征在于具体步骤是:步骤(1)、预处理:选取待检测视频数据集,将视频中的图像数据帧变成灰度图像,图像尺寸规范化为M×N,M和N分别代表图像的宽和高;将数据集的前P帧作为训练集Y,剩余的Q帧作为测试集T,组成Y的数据都是正常行为的样本数据;步骤(2)、训练阶段:步骤(2‑1).设Y中第i帧图像为yi;首先,每隔M1帧连续取k帧图像,即得到作为训练样本一的第i个数据;其次,每隔M2帧连续取k帧图像,即得到作为训练样本二的第i个数据;最后,每隔M3帧连续取k帧图像,即得到作为训练样本三的第i个数据;其中j表示相隔帧数的倍率,j∈[0,k‑1];得到三个训练样本集Y1、Y2、Y3,分别由所有的Y1i、Y2i、Y3i组成,即Y1={Y1i}、Y2={Y2i}、Y3={Y3i};其中0≤i≤P‑1‑max(M1,M2,M3)×(k‑1);步骤(2‑2).以Y1、Y2、Y3作为输入分别送到Alexnet网络中,将网络的第3层输出作为提取的特征,并对得到的特征进行归一化处理,得到三组特征数据集合F1、F2、F3,它们分别由相应的所有样本集数据的特征所组成;步骤(2‑3).为F1、F2、F3的每个特征数据赋予一个标签值,因为训练样本都是正常行为,标签数据分别为L1={1}、L2={1}、L3={1},|L1|=|L2|=|L3|=|F1|=|F2|=|F3|,其中符号“||”表示求集合的元素个数;步骤(2‑4).将三组特征数据F1、F2、F3及其相应的标签数据L1、L2、L3表示为三个样本集:{F1,L1}、{F2,L2}、{F3,L3},作为三组输入分别送到三个一类支持向量机进行训练,得到三个一类支持向量机,分别记做one‑SVM1,one‑SVM2,one‑SVM3;步骤(3)、测试阶段:步骤(3‑1).设T中第n帧图像为tn;首先,每隔M1帧连续取k帧图像,即得到作为测试样本一;其次,每隔M2帧连续取k帧图像,即得到作为测试样本二;最后,每隔M3帧连续取k帧图像,即得到作为测试样本三;其中0≤n≤Q‑1‑max(M1,M2,M3)×(k‑1),j表示相隔帧数的倍率,j∈[0,k‑1];步骤(3‑2).以T1n、T2n、T3n作为输入分别送入训练阶段步骤(2‑1)的Alexnet中,将网络的第3层输出作为提取的特征,并对得到的特征进行归一化处理,得到三组特征数据TF1n、TF2n、TF3n;步骤(3‑3).为待测试特征TF1n、TF2n、TF3n设定一个初始标签值,记为TL1n=1、TL2n=1、TL3n=1;步骤(3‑4).将三组特征数据TF1n、TF2n、TF3n及其相应的标签值TL1n、TL2n、TL3n表示为三个输入样本:{TF1n,TL1n}、{TF2n,TL2n}、{TF3n,TL3n},作为三组输入分别送到one‑SVM1、one‑SVM2、one‑SVM3中进行检测,输出三个测试样本的分类标签值,若分类标签值等于1表示模型检测出该帧图像为正常帧,分类标签值等于‑1则表示模型检测出该帧为异常帧;步骤(3‑5).对三个分类标签值进行投票,投票规则是:如果三个分类标签值中有任意两个或两个以上的值为1,则最终输出结果为1,表示该帧图像的人群行为正常;如果三个分类标签值中有任意两个或两个以上的值为‑1,则最终输出结果为‑1,表示该帧图像的人群行为异常,从而得到最终标签输出,得到模型的检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711145995.0/,转载请声明来源钻瓜专利网。