[发明专利]一种基于稀疏低秩的人体行为识别方法有效

专利信息
申请号: 201610184336.7 申请日: 2016-03-28
公开(公告)号: CN105868711B 公开(公告)日: 2020-04-17
发明(设计)人: 解梅;程石磊;王博;周扬 申请(专利权)人: 电子科技大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 电子科技大学专利中心 51203 代理人: 张杨
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于数字图像处理技术领域,涉及计算机视觉、模式识别、机器学习和数据挖掘等相关理论知识。本发明首先利用光流直方图对相邻两帧图片提取光流特征,并对单帧图像提取梯度直方图信息,获得监测场景内的运动特征信息,采用低维空间的特征信息并按照[动作1|动作2|动作3|……]的方式排列;然后用K均值的方式聚类,得到聚类中心后,将聚类中心作为过完备字典,求解测试样本在过完备字典下的稀疏低秩表达,得到表达矩阵;最后根据表达矩阵中的最大值求解出该测试样本所属的行为类别。本发明采用基于低秩稀疏的人体动作识别,采用交叉验证的方法,识别率92.3~98.79%,误识率1.21~7.6%。本发明具有具有低秩特点,且识别率上达到92.3~98.79%,误识率1.21~7.6%。
搜索关键词: 一种 基于 稀疏 人体 行为 识别 方法
【主权项】:
一种基于稀疏低秩的人体行为识别方法,具体步骤如下:步骤1、视频图像灰度转换并提取场景特征步骤1‑1:首先接收监测设备采集到的视频流,对得到的单帧图像进行灰度化处理。步骤1‑2:将每帧图片归一化成96*48的大小;每个cell的大小为8*8的像素点,每个block中包含2*2个cell即16*16的像素点;相邻block有一半的区域是重叠的;梯度方向分为9个方向,得到的一张图片的梯度直方图HOG特征向量为1980维;对连续两帧灰度图像在3*3的网格中提取光流直方图特征HOF,即每3*3的网格求出一个光流特征向量,根据视频帧的不同大小得到N个光流特征向量,将光流范围0~2π等分成32个子空间,构建32维的直方图B,在统计直方图时,根据角度值对应位置投票,投票所得结果作为权值,因此得权值向量h=[hk],k={1,2,3…,K},其中k为每个网格的索引值,K是网格总数,hk为第k个网格中32维直方图B对应的权值;步骤2、特征聚类设光流特征向量x=[xi],i={1,2,3…,m},对于每一个特征向量,动作类型计算公式:<mrow><msup><mi>C</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></msup><mo>=</mo><munder><mi>argmin</mi><mi>j</mi></munder><mo>|</mo><mo>|</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>-</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>,</mo><mi>j</mi><mo>=</mo><mo>{</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>3</mn><mo>...</mo><mo>,</mo><mi>K</mi><mo>}</mo></mrow>对于每类动作C(j)j,计算该类质心这里K表示聚类中心,取值500~2000;步骤3、低秩稀疏表达步骤3‑1:将聚类中心构成的字典D=[dk],k={1,2,3…,n},则X为一个ds×n的矩阵,ds为特征维度,识别样本集X=[xk],k={1,2,3…,n},X中的任意一列xi都可以用D进行线性表达,将这种关系式写为:X=DZ+E,其中Z的每一列表示X的对应列用D进行线性表达的系数,矩阵Z称之为表达子,E为由噪声引起的误差;步骤3‑2:据此建立目标方程:argminZ,E||Z||*+β||Z||1+γ||E||1 s.t.X=DZ+E式1其中β和γ分别表示各项的关注因子,它们的值越大,表示相关项越受关注,这里β=2,γ=2,公式中分别用核范数和L1范数求解低秩和稀疏问题;步骤3‑3:求解步骤3‑2中的式1,这里用到了增广拉格朗日乘数法,得到目标函数后分别对各个参数进行迭代优化,则参数的迭代过程为:<mrow><msub><mi>Z</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>J</mi><msup><mrow><mo>(</mo><mrow><msub><mi>&eta;&mu;</mi><mi>k</mi></msub></mrow><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup></msub><mrow><mo>(</mo><msub><mi>Z</mi><mi>k</mi></msub><mo>+</mo><mfrac><mrow><mi>Q</mi><mrow><mo>(</mo><mi>D</mi><mo>,</mo><mi>X</mi><mo>,</mo><msub><mi>Z</mi><mi>k</mi></msub><mo>,</mo><msub><mi>Y</mi><mrow><mn>1</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>,</mo><msub><mi>Y</mi><mrow><mn>2</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>,</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow><mi>&eta;</mi></mfrac><mo>)</mo></mrow><mo>;</mo></mrow>其中<mrow><msub><mi>W</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>&Theta;</mi><mrow><msubsup><mi>&beta;&mu;</mi><mi>k</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></msub><mrow><mo>(</mo><msub><mi>Z</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>+</mo><mfrac><msub><mi>Y</mi><mrow><mn>2</mn><mo>,</mo><mi>k</mi></mrow></msub><msub><mi>&mu;</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>,</mo></mrow><mrow><msub><mi>E</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>&Theta;</mi><mrow><msubsup><mi>&gamma;&mu;</mi><mi>k</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></msub><mrow><mo>(</mo><mi>X</mi><mo>-</mo><msub><mi>DZ</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>+</mo><mfrac><msub><mi>Y</mi><mrow><mn>1</mn><mo>,</mo><mi>k</mi></mrow></msub><msub><mi>&mu;</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>Y1,k+1=Y1,kk(X‑DZk+1‑Ek+1),Y2,k+1=Y2,kk(Zk+1‑WK+1),μk+1=ρμk,其中函数J和Θ分别表示奇异值压缩算子和压缩算子,ρ=1.1,各参量的初始值为Z0=W0=E0=Y1,0=Y2,0=0;步骤4、行为识别步骤4‑1、通过步骤3求得的稀疏低秩矩阵Z,其中Z的每一列就是待识别样本在D中的线性表达,现在只需要找出表达最大的那个系数即可知道待识别样本所属的类别,采用最大池化法,即找出矩阵Z中每一行的最大值;令yi=max(|zi1|,|zi2|,…|z|in),i=1,2,…l;步骤4‑2、得到矩阵Z中每一行的最大值yi,取最大值中的前十个,分别找出这十个值所对应的相应类别,并计算该类别在矩阵Z中对应的系数,并把相同类别的系数叠加起来,得到的最大值所对应的类别即为最终的识别结果,相应的计算公式如下:yi=max(|zi1|,|zi2|,...|zin|),i=1,2,...T上式表示取Z中行向量中最大值的前T个;分别找出对应的Pj=Ci(yi),i=1,2,…T,其中Ci(yi)为步骤2的聚类结果;其中δ(·)是Dirac Delta函数,PreC即为最终的识别结果,T取5~10。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610184336.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top