[发明专利]基于局部直觉模糊支持向量机的异常行为识别方法在审
| 申请号: | 202211317205.3 | 申请日: | 2022-10-26 |
| 公开(公告)号: | CN115690677A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 陈伟杰;陈培;孙辉锋;陈彦榕 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V40/20;G06V10/46;G06V10/764 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 舒良 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 局部 直觉 模糊 支持 向量 异常 行为 识别 方法 | ||
1.基于局部直觉模糊支持向量机的异常行为识别方法,包括如下步骤:
步骤一:异常行为数据集的构建;首先,使用Opencv实时捕获监控视频流,采样生成视频帧图像;然后,对采样的图像进行去噪声,灰度化,直方图均衡化等预处理,并使用mediapipe开源模块对图像中人体提取姿势关键点;然后,使用这些关键点构造姿势特征xi,同时对样本的输出yi进行手工标注是否为异常行为,1代表异常行为,2代表正常行为;最后,对数据进行归一化,得到有监督数据集其中为维度n的样本特征,yi为样本相应的输出,m为样本规模;将数据集按类别分为两个不重复的部分:异常行为的少数类(标注为1)的数据样本矩阵(简称:A)和正常行为的多数类(标注为2)的数据样本矩阵((简称:B(),其中m1和m2分别为少数类和多数类的样本个数;定义数据类不平衡率k是kNN近邻算法的参数,表示选取的“近邻”个数;为第s类样本合集,s=1,2;
步骤二:根据kNN算法和四分位数方法分别计算少数类和多数类两个类别的类内权重,记作表示第s类中的第i个样本的类内权重;
(2.1)通过计算每个样本与其同类领域内近邻样本的距离,并对这些距离求均值获得样本与同类样本的偏离程度,记作表示第s类中的第i个样本的类内偏离程度;
其中,xi是第s类中的第i个样本,xm是xi的kNN样本;
(2.2)按类别,对所有同类样本的偏离程度求分位数,具体包括各类别的上四分位数、下四分位数以及四分位差,分别记作以及IQR(s),s=1,2,表示第s类的上下四分位数以及四分位差;
(2.3)按类别,在不同类中分别计算各自的上异常值截断点,记作t(s),s=1,2,表示第s类的上异常值截断点;
(2.4)根据上异常值截断点的性质,如果样本的偏离程度越接近同类别的上异常值截断点值,则说明该样本越偏离分布中心,即该样本被赋予更小的类内权重,但不小于0;又因为少数类和多数类样本数量不平衡,但更少的少数类样本具有更重要研究价值,所以应当最大可能的保护它们;基于以上分析,类内权重构造如下:
对于少数类样本:
对于多数类样本:
步骤三:根据kNN方法和直觉模糊方法,分别计算少数类和多数类两个类别的类间权重;
(3.1)隶属度计算:使用步骤二相同计算的方法,计算隶属度值,记作表示第s类中的第i个样本的隶属度;其意义为第i个样本属于第s类的概率;
(3.2)非隶属度计算:结合kNN方法和直觉模糊方法,重新定义非隶属度:
(3.2.1)结合两类数据的信息计算类间相关性,记作表示第s类中的第i个样本的类间相关性,构造如下:
其中,和分别表示第i个样本的kNN中,第1类样本数量和第2类样本数量;这里对少数类的类间相关性的计算加入r,是因为少数类数据和多数类数据在样本数量上差了r倍,所以这里模拟了在每个少数类样本附近增加r倍的数据,目的是为了在理论上尽量平衡少数类数据和多数类数据样本数量;
(3.2.2)根据隶属度和类间相关性计算样本非隶属度,记作表示第s类中的第i个样本的非隶属度;其意义为第i个样本不属于第s类的概率;
(3.3)根据隶属度和非隶属度,计算样本类间权重,记作表示第s类中的第i个样本的类间权重,构造如下:
式(8)的操作是为了构造样本类间权重,具体如下:当非隶属度为0时,类间权重等于隶属度值;当非隶属度值不小于隶属度值时,类间权重为0;其他情况时,类间权重
(3.4)对多数类样本的类间权重进一步修正,如下:
式(9)表示在overlap区域,当多数类样本的kNN中,少数类样本数量的r倍不小于多数类样本数量时,该多数类样本的类间权重缩小r倍;否则保持不变;目的是为了在样本overlap区域中,应尽可能的保护少数类样本;
步骤四:LIFSVM方法,类似双子支持向量机,为少数类和多数类分别寻找一近端超平面f1(x),f2(x),即:
其中,f1(x),f2(x)是异常行为和正常行为的近端超平面,w1,2,b1,2是对应超平面的权重和偏置,x是样本的特征;
为了实现经验风险,LIFSVM考虑下面两个损失函数
和
其中,q(1),q(2)是少数类和多数类样本的类内权重,f(1),f(2)是少数类和多数类样本的类间权重;c1,c2>0是惩罚参数;
然而,如果LIFSVM只是关注经验风险最小化,这可能会导致在实践中出现过拟合,同时也会出现另一个难点,即在其学习过程中可能会出现矩阵的奇异点;为了克服以上问题,通过引入一个额外的正则项||w||2+b2,提出了结构风险最小化版本;然后,得到了LIFSVM的原始问题
其中,ξ是非负的松弛变量;ci,i=1…4是惩罚参数;
为了表述方便,将上述样本的向量形式式(13)和式(14),转化为下面的矩阵形式:
其中,式(15)和(16)分别是,为了寻找异常行为和正常行为的近端超平面的优化问题;Q1和Q2是对角矩阵,其主对角线上为少数类和多数类的类内权重式(4)和式(5),F1和F2是对角矩阵,其主对角线上为少数类和多数类的类间权重式(8)和式(9),定义如下:
用于控制样本在类内或类间中的影响;e1,e2是适当维度的单位向量;
对少数类的优化问题式(15)进行分析,最小化目标函数的第一项是为了使少数类的样本到第一个超平面距离更近,即样本尽量聚集在超平面附近;目标函数第二项是松弛变量的平方损失函数,第二个约束条件要求多数类的样本与第一个超平面的距离至少为1,松弛变量在约束条件不满足时度量误差,即最小化前两项,旨在最大化的将多数类样本与少数类样本分离开;最后一项为正则项,为了实现结构风险最小化,即权衡模型复杂度和模型精准度,避免过拟合;同理优化问题式(16)与式(15)类似;
步骤五:求解步骤四中的两个优化问题;
(5.1)以优化问题(15)为例,先将等式约束代入到目标函数中,可得到
(5.2)将(18)式对ω1,b1求梯度,并设梯度等于0,得
(5.3)根据式(19)和式(20),求解得
其中,H1=rQ1[A e1],G1=F2[B e2],I表示为单位矩阵;
(5.4)同理,求解得
其中,H2=F1[A e1],G2=Q2[B e2];到此,LIFSVM方法的训练阶段完成;
步骤六:识别异常行为;当获得模型最优参数后,构建异常行为预测决策函数;对于给定待检测视频图像,首先使用Opencv实时捕获视频流,然后使用mediapipe开源模块提取人体提取姿势关键点;最后,使用这些关键点生成人体姿势特征x;针对给定的特征x,分别计算特征x到异常行为和正常行为近端超平面(10)的距离来预测场景是否为异常行为,决策函数如下:
其中,|·|表示绝对值;如果特征x离异常行为近端超平面的距离比正常行为近,那么式(23)输出为1,系统判断当前样本x为异常行为,并执行异常行为记录或报警;如果特征x离正常行为近端超平面的距离比异常行为近,那么式(23)输出为2,系统判断当前样本x为正常行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211317205.3/1.html,转载请声明来源钻瓜专利网。





