[发明专利]一种基于随机投影多核学习的手势识别方法有效

专利信息
申请号: 201710085235.9 申请日: 2017-02-17
公开(公告)号: CN106909895B 公开(公告)日: 2020-09-22
发明(设计)人: 王淼;孙季丰;余家林;宋治国 申请(专利权)人: 华南理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06K9/46;G06K9/34;G06T7/90
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 随机 投影 多核 学习 手势 识别 方法
【权利要求书】:

1.一种基于随机投影多核学习的手势识别方法,其特征在于,包括如下步骤:

S1、采集手势图像,并对图像进行预处理,预处理包括手势定位和手势分割;

S2、对预处理分割后的手势提取sift特征;

S3、采用k-means算法训练学习字典,然后使用迭代字典更新算法更新字典;

S4、对手势图像进行空间金字塔划分,并对在每层空间金字塔中对手势图像的sift特征,根据训练得到的字典进行编码,得到特征向量,并对特征向量进行级联,接着使用随机投影进行对特征向量降维;

S5、对每层金字塔降维后的特征向量学习核矩阵,学习核矩阵方法采用多核模型学习算法进行分类学习,得到最优核矩阵组合系数;

所述步骤S5具体为:

S51、采用非线性径向基核函数Kl(xi,xj)=exp(-γlf(xi,xj)),其中γl取所有训练数据距离的平均值,是第l层空间金字塔的特征向量xi和xj映射到φ特征空间后向量的点积,即对每层金字塔学习一个核矩阵;

S52、根据核矩阵,采用多核模型学习算法得到最优核矩阵组合系数,并得到最终分类的核矩阵在支持向量机的基础上,利用训练集学习得到最优的核矩阵系数,目标函数定义为:

s.t.yi(wtφ(xi)+b)≥1-ξi,ξ≥0,d≥0,Ad≥p

其中,C为惩罚项,Ad≥p为限制项,此时将核矩阵改写为:

采用投影梯度法求解最小的T(d),即的求解是这个优化问题的关键,因此将问题进行转化求解,得到其对偶式为:

s.t.0≤α≤C,1tYα=0

其中Y是标记训练数据类别的对角矩阵,Kl为核矩阵K的第l列,α与支持向量有关;根据强对偶的原理,对于任意系数d,都有T(d)=W(d),记W取最大值时,α的值为α*,并且具有唯一性;由于核矩阵都是严格可微的,因此W取最大值时也是可微的,因此有:

最终得到系数d,再根据训练的数据求解分类器参数a和b,得到多核模型分类器

2.根据权利要求1所述的一种基于随机投影多核学习的手势识别方法,其特征在于,所述步骤S1中预处理,具体为:

S11、采用Grayworld光线补偿算法,降低光照环境对于后续手势分割的影响;

S12、采用HSV和Ycbcr混合空间模型方法进行肤色检测,进一步定位手势区域,在手势区域内提取手势的最小外接矩形;

S13、在最小外接矩形中,采用形态学的膨胀与腐蚀操作,对手势进行分割处理以及平滑手势的边缘;最后在最小外接矩形内提取手势。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710085235.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top