[发明专利]基于稀疏表示的动态手势识别方法在审
申请号: | 201410079781.8 | 申请日: | 2014-03-06 |
公开(公告)号: | CN103824063A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 韩红;洪汉梯;陈建;李楠;刘三军;史媛媛;曹赛 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于稀疏表示的动态手势识别方法,克服了现有技术中手势特征的提取受背景环境的影响而导致识别率下降,且将手势识别过程进行数学建模,导致手势识别过程太复杂的问题。本发明的具体实现步骤如下:(1)建立数据库;(2)提取时空兴趣点;(3)构建立方体;(4)提取三维SIFT特征;(5)训练字典;(6)稀疏表示;(7)训练支持向量机分类器;(8)分类。本发明能够有效克服手势识别过程中背景环境对特征提取的影响,提高手势识别的识别率,而且不需要复杂的数学建模过程,降低了手势识别过程的计算量和复杂性。 | ||
搜索关键词: | 基于 稀疏 表示 动态 手势 识别 方法 | ||
【主权项】:
1.一种基于稀疏表示的动态手势识别方法,包括如下步骤:(1)建立数据库:(1a)拍摄九种手势,其中每种手势包括15个视频,将拍摄的135个视频组成训练数据库;(1b)拍摄与组成训练数据库相同的九种手势,其中每种手势包括10个视频,将拍摄的90个视频作为测试数据库;(2)提取时空兴趣点:(2a)对训练数据库和测试数据库中每一个视频进行时域伽柏Gabor滤波和空域高斯Gaussian滤波,获得每个视频的每帧图像像素点处的响应值R;(2b)将每个视频中每帧图像像素点响应值R大于等于阈值的像素点定义为时空兴趣点;(3)构建立方体:(3a)在时空兴趣点所在图像上,截取一个以时空兴趣点为中心,以40个像素点为边长的正方形图像块;(3b)将时空兴趣点所在的图像选为中心帧图像,沿着每一个视频的时域方向在中心帧图像的前和后取相同数量帧的多帧图像;(3c)从除中心帧图象以外的其它多帧图象上,选取与中心帧图象位置相同的正方形图像块,将所提取的正方形图像块,按照每帧图象在视频中的先后顺序排列组成一个图像块的立方体;(4)提取三维SIFT特征:(4a)按照下式,求得图像块立方体中每个像素点的空域方向值和时域方向值:θ=arctan(L2/L1)
其中,θ表示图像块立方体中每个像素点的空域方向值,L1和L2分别表示图像块立方体中每个像素点在空间域横轴和纵轴上的梯度分量值,
表示图像块立方体中每个像素点的时域方向值,L3表示图像块立方体中每个像素点在时间轴上的梯度分量值;(4b)将每一个图像块的立方体均分成8个大小相等的立方体,将每个立方体中每个像素点的空域方向作为x轴,将每个立方体中每个像素点的时域方向作为y轴,将立方体中像素点的个数作为z轴,构造8个三维梯度直方图,将图像块立方体中提取的8个三维梯度直方图级联,形成三维尺度不变特征变换SIFT特征;(5)训练字典:(5a)将训练数据库中所有视频里提取的三维尺度不变特征变换SIFT特征作为字典训练集;(5b)采用稀疏表示的字典设计KSVD法,对字典训练集进行字典训练,获得超完备字典;(6)稀疏表示:(6a)利用超完备字典,计算训练数据库和测试数据库中每个视频的所有三维SIFT特征的稀疏表示系数向量;(6b)对稀疏表示系数向量进行极大池max pooling操作,得到训练数据库中所有视频和测试数据库中所有视频的稀疏表示系数向量;(7)训练支持向量机分类器:用训练数据库中所有视频的稀疏表示系数向量对支持向量机分类器进行训练,得到训练好的分类器;(8)分类:用训练好的分类器对测试数据库中所有视频的稀疏表示系数向量进行分类,得到最终分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410079781.8/,转载请声明来源钻瓜专利网。
- 上一篇:双层路边无避让停车装置
- 下一篇:自动吸水发电节能减排机械装置