[发明专利]一种基于全局特征和稀疏表示分类的人体行为识别方法有效

专利信息
申请号: 201711111597.7 申请日: 2017-11-13
公开(公告)号: CN107784293B 公开(公告)日: 2018-08-28
发明(设计)人: 李策;杨峰;李若童;刘瑞莉 申请(专利权)人: 中国矿业大学(北京)
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100083 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于全局特征和稀疏表示分类的人体行为识别方法。对视频帧进行高斯核卷积滤波预处理,差分法提取运动前景像素;据参数在时空维度对像素值采样确定运动区域,调整视频帧的大小初步降维,将每帧视频按列拼接成向量组合得到特征向量;将特征向量按列拼接成特征矩阵后第二次降维,求得特征矩阵构成最初特征字典,对字典初始化后采用类别一致K次矩阵奇异值分解法进行字典学习,据所得字典求得输入信号稀疏编码,编码送入分类器输出行为类别;统计字典学习参数并实现实时行为识别。本发明得出兼具重构性能和分类性能的字典和线性分类器,可用于提高人体行为识别效率,适用于安防监控、基于内容的视频检索、虚拟现实等科学领域。
搜索关键词: 一种 基于 全局 特征 稀疏 表示 分类 人体 行为 识别 方法
【主权项】:
1.一种基于全局特征和稀疏表示分类的人体行为识别方法,其特征在于,包括以下步骤:步骤(1)、获取人体行为视频,采用MATLAB内置的视频读取函数将获得的每个视频片段转换为一个h×w×F的三维矩阵,h为视频帧的高度,w为视频帧的宽度,第三维F的数值代表了视频的帧数,h×w为视频的每一帧的大小;步骤(2)、视频预处理阶段,先通过高斯核对视频的每一帧进行高斯卷积滤波,然后对视频帧图像使用差分法获取前景图像,对前景图像进行均值滤波以平滑噪声;步骤(3)、根据参数(h,w,pathWin,srs,trs,tprlen)在时空维度对像素值采样确定运动区域,其中,h为视频帧的高度,w为视频帧的宽度,srs为采样点的空间分布,trs为采样点在时间维度的分布,patchWin决定了采样点周围立方体的长和宽,tprLen决定了采样点周围立方体的帧数跨度;将每一帧及其前后两帧的像素累加作为当前帧的运动区域;在确定运动区域时,采用采样的方式;采样间隔分为空间间隔与时间间隔,在某个采样点上的像素值的累加若是超过了设定的阈值,则将该采样点周围由参数patchWin和tprLen决定的视频立方体的像素值标记为运动块,若某个采样点上的像素值的累加小于设定的阈值则该采样点周围由参数patchWin和tprLen决定的视频立方体像素值被置为零,否则不做改变;步骤(4)、在时空维度对像素值采样确定完运动区域之后,将视频帧调整大小以降低拼接特征的维数进行初步降维,具体为:将每一帧图像按列拼接成向量,N帧图像的向量首尾相接组合成一个特征向量;步骤(5)、将全部特征向量按列拼接构成特征矩阵,来自不同类别的特征数量一致且位置相邻,用随机生成的均值为零的正态分布矩阵将特征矩阵投影到低维空间,作为第二次降维;步骤(6)、第二次降维后的特征矩阵构成了最初的特征字典;对特征字典进行初始化操作:输入得到的特征字典、特征的类别、迭代次数和迭代阈值,对每个类别的子字典分别进行初始化,然后将不同类别的子字典拼接在一起作为初始化的字典,初始化操作的输出为初始化的字典D、线性变换矩阵A、初线性分类参数W以及训练特征的最优编码矩阵;在字典初始化过程中,使用多元岭回归的方法以及二次平方损失和l2范数正则化项初始化线性分类参数W和线性变换矩阵A,公式如下:A=(XXt+λ1I)‑1XQt,    (1)W=(XXt+λ1I)‑1XHt,    (2)其中,X表示输入样本在特征字典下的编码矩阵;Q是训练样本的类别矩阵,其列数等于训练样本数,行数等于字典原子数;H为输入样本的类别矩阵,其列数等于训练样本数,行数等于类别数,λ1是正则化参数,I表示单位矩阵,t表示矩阵转置;在字典初始化过程结束后,进入字典学习阶段,采用类别一致的K次矩阵奇异值分解法进行字典学习,公式表示如下:其中,D表示初始化的字典,W表示线性分类参数,X表示所有输入样本在特征字典下的稀疏编码矩阵,A表示线性变换矩阵,Y表示输入样本,α表示稀疏编码误差项的贡献系数,β表示分类器的误差项的贡献系数,T0表示稀疏编码的稀疏度,xi表示第i个输入样本在特征字典下的稀疏编码;将公式(3)改写为:其中,则公式(3)学习的目标为:通过得到期望得到的字典变换参数以及线性分类器其中,K表示类别数目,A={a1...aK}为线性变换矩阵,D={d1...dK}为初始化的字典,W={w1...wK}为线性分类参数,aK表示第K个线性变换向量,dK表示第K个字典向量,wK表示第K个线性分类向量;步骤(7)、行为类别识别:输入样本为y,首先求得它在字典下的稀疏编码:然后将公式(6)表示的稀疏编码送入到线性分类器使用线性分类器来估算输入样本y的类别j:其中,l∈Rm是类别向量;步骤(8)、统计结果、调整特征提取、字典学习参数,再次进行识别分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711111597.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top