[发明专利]一种基于随机投影多核学习的手势识别方法有效
| 申请号: | 201710085235.9 | 申请日: | 2017-02-17 |
| 公开(公告)号: | CN106909895B | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 王淼;孙季丰;余家林;宋治国 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/46;G06K9/34;G06T7/90 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 随机 投影 多核 学习 手势 识别 方法 | ||
1.一种基于随机投影多核学习的手势识别方法,其特征在于,包括如下步骤:
S1、采集手势图像,并对图像进行预处理,预处理包括手势定位和手势分割;
S2、对预处理分割后的手势提取sift特征;
S3、采用k-means算法训练学习字典,然后使用迭代字典更新算法更新字典;
S4、对手势图像进行空间金字塔划分,并对在每层空间金字塔中对手势图像的sift特征,根据训练得到的字典进行编码,得到特征向量,并对特征向量进行级联,接着使用随机投影进行对特征向量降维;
S5、对每层金字塔降维后的特征向量学习核矩阵,学习核矩阵方法采用多核模型学习算法进行分类学习,得到最优核矩阵组合系数;
所述步骤S5具体为:
S51、采用非线性径向基核函数Kl(xi,xj)=exp(-γlf(xi,xj)),其中γl取所有训练数据距离的平均值,是第l层空间金字塔的特征向量xi和xj映射到φ特征空间后向量的点积,即对每层金字塔学习一个核矩阵;
S52、根据核矩阵,采用多核模型学习算法得到最优核矩阵组合系数,并得到最终分类的核矩阵在支持向量机的基础上,利用训练集学习得到最优的核矩阵系数,目标函数定义为:
s.t.yi(wtφ(xi)+b)≥1-ξi,ξ≥0,d≥0,Ad≥p
其中,C为惩罚项,Ad≥p为限制项,此时将核矩阵改写为:
采用投影梯度法求解最小的T(d),即的求解是这个优化问题的关键,因此将问题进行转化求解,得到其对偶式为:
s.t.0≤α≤C,1tYα=0
其中Y是标记训练数据类别的对角矩阵,Kl为核矩阵K的第l列,α与支持向量有关;根据强对偶的原理,对于任意系数d,都有T(d)=W(d),记W取最大值时,α的值为α*,并且具有唯一性;由于核矩阵都是严格可微的,因此W取最大值时也是可微的,因此有:
最终得到系数d,再根据训练的数据求解分类器参数a和b,得到多核模型分类器
2.根据权利要求1所述的一种基于随机投影多核学习的手势识别方法,其特征在于,所述步骤S1中预处理,具体为:
S11、采用Grayworld光线补偿算法,降低光照环境对于后续手势分割的影响;
S12、采用HSV和Ycbcr混合空间模型方法进行肤色检测,进一步定位手势区域,在手势区域内提取手势的最小外接矩形;
S13、在最小外接矩形中,采用形态学的膨胀与腐蚀操作,对手势进行分割处理以及平滑手势的边缘;最后在最小外接矩形内提取手势。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710085235.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:沥青刮刀装置
- 下一篇:一种果蔬农药残留检测中样本捣碎装置





