[发明专利]一种人体动作识别的方法有效
申请号: | 201310054812.X | 申请日: | 2013-02-20 |
公开(公告)号: | CN103164694A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 宫辰;傅可人;杨杰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 动作 识别 方法 | ||
1.一种人体动作识别的方法,其特征在于,如下包括步骤:
第一步,捕获运动人体的大致位置和轮廓;
第二步,计算运动人体的空间特征,获得前帧人体的轮廓直方图、横向即x方向及纵向即y方向的光流直方图,并把计算结果拼接成一个216维的特征向量;
第三步,计算运动人体的时间特征,将当前帧和其前、后各7帧放在一起组成一段长15帧的片段,并采用局部线性嵌入法将1~5帧,6~10帧,及11~15帧的特征向量分别降至50,100,50维;
第四步,形成描述当前帧人体运动姿态的最终特征向量,即将第二、三步获得的特征进行组合得到最终的特征向量,共计416维;
第五步,建立图模型G:将待分类的动作序列切成一帧一帧的图片形式,并和已知动作图片放在一起建立K近邻图G;
第六步,求解广义拉普拉斯矩阵根据图G的邻接矩阵W和相应的度矩阵D,计算广义拉普拉斯矩阵
第七步,获得每一帧的标签向量Fi:将广义拉普拉斯矩阵代入预设的目标函数并进行求解,从而对于视频序列中的每一帧图片i都能获得一个标签向量Fi;
第八步,识别结果输出:向量Fi中最大元素所在的列代表的动作类别即为第i帧中人体正在执行的动作。
2.根据权利要求1所述的人体动作识别的方法,其特征在于:所述第一步中,采用帧差法捕获运动人体的大致位置和轮廓,即用当前帧图像减去上一帧图像,再对得到的帧差图像进行去噪、腐蚀、膨胀处理获得运动人体轮廓图像,并得到感兴趣的矩形区域Ri。
3.根据权利要求2所述的人体动作识别的方法,其特征在于:所述第二步,具体为:将第一步中得到的矩形区域Ri分成2×2的四个子区域,每一个子区域对应一个表征方向的饼状图,该饼状图的中心与子区域的中心重合,以x轴正半轴所在方向为0°角,每隔20°取一次值,则360°的圆盘被平均分成了18份,于是每一份的区间分别为[1°,20°],[21°,40°],…,[341°,360°],通过统计轮廓走向落在这些区间的次数得到包含18个区间的轮廓统计直方图即18维的特征向量,光流特征的计算采用Lucas-Kanade方法,求解如下的关于光流(u,v)的约束方程:
Ixu+Iyv+Ii=0
求得(u,v)后,再分别在x方向和y方向做中值滤波,采用轮廓统计直方图的获得方法,得到在x和y两个方向各18维的光流统计直方图,所以描述每个子区域的特征向量共有18×3=54维,Ri被分成了2×2的四个子区域,所以第i帧的人体运动情形用54×2×2=216维的特征向量表示。
4.根据权利要求1所述的人体动作识别的方法,其特征在于:所述第三步,具体为:假设当前为第i帧,需要考察的片段组成为第i-7,…,i-1,i,i+1,…,i+7帧共15帧,将这15帧平均分为三段,每一段由216×5=1080维的特征向量进行表示,采用局部线性嵌入的方法分别将这三段对应的特征向量降至50,100,50维,于是第i帧的时间信息由200维的特征向量来表示。
5.根据权利要求1所述的人体动作识别的方法,其特征在于:所述第五步,具体为:假设有很少量的已知动作类别的帧图像,它们构成l个已标记样本其中y为动作类别的标签;另有大量未知类别的待分类帧图像,它们构成u个未标记样本且设l+u=n,l<<u,于是动作识别的任务就转化为建立函数f,根据已知样本集去推断中各样本的标签;图G用G=<V,E>来加以描述和中的样本,其中V代表节点集,E代表连接这些节点的边所构成的集合;对于动作识别问题,各样本xi(1≤i≤n)在图G中用节点表示,它们之间的相似程度用含有权重的边表示,权重的计算公式采用径向基函数ωij=exp(-||xi-xj||22σ2),其中σ为待调参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310054812.X/1.html,转载请声明来源钻瓜专利网。