[发明专利]一种基于HOG特征的多旋转方向SVM模型的手势跟踪方法有效
| 申请号: | 201510079498.X | 申请日: | 2015-02-13 |
| 公开(公告)号: | CN104731323B | 公开(公告)日: | 2017-07-04 |
| 发明(设计)人: | 牛建伟;赵晓轲;苏一鸣 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00 |
| 代理公司: | 北京永创新实专利事务所11121 | 代理人: | 祗志洁 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 hog 特征 旋转 方向 svm 模型 手势 跟踪 方法 | ||
技术领域
本发明涉及一种基于HOG特征的多旋转方向SVM模型的手势跟踪方法,属于图像处理以及模式识别技术领域。
背景技术
现如今,计算机的普及和迅速发展使得人们的生活越来越依赖计算机,计算机无处不在。在以往的人和计算机交互技术中,特定的输入输出设备,如有键盘、鼠标、手写笔、扫描仪等,被广泛采用。近几年,随着计算机性能的大幅度提高,个人计算机(PC)已具有语音处理、图形图像处理等多种通信媒体的能力。为提高计算机的易用性和人机交互的自然性,新型输入技术已俨然成为一个备受广大用户和科研工作者关注的研究热点领域。人工智能的飞跃发展和新式输入输出设备如雨后春笋般的不断涌现,使得计算机变得越来越智能化,人机交互也变得更加的自然。人机交互技术的研究历经以计算机为中心的传统交互,现在已逐步转移到以人为中心的多种通道、多种媒体的新型交互技术上来。体势识别、人脸识别、表情识别、头部跟踪、眼球跟踪以及手势识别等新式技术都是为符合人的习惯而出现的新型人机交互技术。生活中,我们总是使用某些固定手势来表达某种特定的意图,例如表示OK,为路人指示方向,表示数字等等。这些现象均说明了手势操作的频繁性和直观自然性,同时也使得人们希望将手势可以用来与自己的计算机进行交互中。例如,用户可以定义适当的手势来对设备进行控制等。
手势识别作为多模式人机接口技术重要部分,涉及了多个学科的研究领域,例如计算机视觉、人工智能、模式识别等。基于视觉的手势跟踪是手势识别方法的重要环节,特别是动态手势识别。人手的运动幅度较大、光照条件的变化、背景差异、在图像中所占区域较小以及形状不断改变,这些均为手势跟踪带来了极大的挑战。此外,手势跟踪算法还要求达到实时性和具有低耗性。方向梯度直方图(Histogram of Oriented Gradient,简称HOG)是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。支持向量机(Support Vector Machine,简称SVM)是一种可用作特征空间分类的机器学习方法。
手势跟踪的方法可以利用不同的方法实现,主要包括基于轮廓的方法、基于区域的方法、基于模板的方法、基于特征的方法以及基于运动信息的方法等。但这些方法很大一部分不能够处理复杂背景下手势的跟踪任务以及兼顾实时性和准确性。
发明内容
本发明的目的是解决平面内规定手势旋转问题,提高利用基于HOG特征的多旋转方向SVM模型对规定手势的定位。
本发明提供了一种基于HOG特征的多旋转方向SVM模型的手势跟踪方法,具体是:
步骤1:获取图像帧,并进行预处理,具体是:
(1)利用摄像头实时抓取镜头前各个图像帧,并对当前帧的图像进行双线性插值处理以得到设定尺寸的图像;
(2)加载HOG特征的相关参数、梯度投值空间对应的字典以及基于HOG特征的各个方向子区间的SVM模型。
步骤2:判断成功定位帧数是否到达预设的帧数阈值T;
设定一个变量x,用于记录到当前帧前连续成功地检测或跟踪到含有手势的帧数,初始x的值为0。
比较成功定位帧数变量x和预设的帧数阈值T,按如下进行:
(1)如果成功定位帧数变量x未达到预设阈值T,那么,调用基于HOG+Multi-SVM的检测模块,进入步骤3执行;
(2)否则,调用基于HOG+Multi-SVM的跟踪模块,进入步骤4执行。
步骤3:基于HOG+Multi-SVM的检测;
对步骤1得到的图像进行各个尺度空间中的HOG特征提取,利用滑动窗口对所有有效窗口进行遍历,并与预先训练的各方向子区间的SVM模型进行匹配,记录匹配的结果,并在匹配成功时记录手势在图像帧的位置和SVM模型的索引号,然后转到步骤5执行。
步骤4:基于HOG+Multi-SVM的跟踪;
对步骤1得到的图像按照设定的尺度空间遍历顺序对HOG特征进行提取,并利用特定方式进行固定窗口的移动,接着,以一定顺序与预先训练的各方向子区间的SVM模型进行匹配。记录匹配的结果,并在匹配成功时记录手势在图像帧的位置和SVM模型的索引号。进入步骤5执行。
步骤5:判定既定手势是否在图像上,并做出相应处理,具体是:
(1)当未在图像中定位到既定手势时,对成功定位的帧数变量x进行清零处理,从而保证下次调用步骤3的检测子模块;
(2)否则,将成功定位的帧数变量x的值增1,并记录既定手势在图像中的位置大小和匹配的SVM模型的索引号。
本发明的优点在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510079498.X/2.html,转载请声明来源钻瓜专利网。





