[发明专利]VR艺术媒体交互环境下基于线性判决和SVM的动作识别方法在审
申请号: | 201910419837.2 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110135372A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 张福泉 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/12 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作识别 媒体交互 遗传算法 人体动作识别 线性判别分析 非线性投影 非线性问题 参数搜索 多维空间 分类识别 分类特征 分类效果 训练样本 样本差异 有效解决 核函数 鲁棒性 子空间 判决 映射 准确率 高维 向量 寻优 算法 艺术 个性 引入 优化 表现 | ||
本发明涉及一种VR艺术媒体交互环境下基于线性判决和SVM的动作识别方法,首先在线性判别分析中引入核函数进行非线性投影以便将训练样本映射到一个高维子空间中,得到最佳分类特征向量,从而有效解决了非线性问题并且扩大了样本差异。并采用遗传算法实现SVM的参数搜索优化,充分利用了遗传算法在多维空间寻优方面的优势。测试结果表明,与其他多种分类识别算法相比,提出方法在人体动作识别的多个性能指标上均表现出良好的分类效果,具有较高的识别准确率和更好的鲁棒性。
技术领域
本发明涉及VR技术领域,特别是一种VR艺术媒体交互环境下基于线性判决和SVM的动作识别方法。
背景技术
在计算机技术快速发展的今天,各种先进的多媒体技术层出不穷。由于具有“身临其境”的真实感,虚拟现实技术(Virtual reality,VR)能够以更加自然和逼真的人机交互方式,给用户带来全新的体验经历。基于VR技术的各种多媒体应用已经逐渐成为了未来文化、艺术和娱乐市场的发展热点方向,例如虚拟购物社区、沉浸式虚拟现实游戏、虚拟景观漫游和虚拟艺术舞台表演等。
其中,艺术场景下的多媒体人机交互技术需要对人体动作进行实时、准确地捕获和识别,以便达到更好的交互效果和艺术感官体验。为了使得人与计算机之间可以更加自然、有效地交流,动作识别交互系统需要能够对各种复杂的、变化的人体动作进行准确识别。
数字表演过程中,肢体语言相对于自然语言常常能表达出演员最真实的情感,因而虚拟环境下,对人机交互动作的准确识别尤其显得十分重要。现阶段,主流的人体动作识别方法主要采用机器视觉技术,涉及图像处理、模式识别、机器学习等先进计算机学科的知识。其中,基于时空特征的图像处理方法和基于表述特征的机器学习方法均具有较高的鲁棒性,成为了目前研究的主流。虽然计算复杂度较高,但是两种动作识别方法能够识别连续动作和交互动作。本发明选择的研究方向为基于机器学习的方法。例如,采用Kinect体感器,文献[石祥滨,刘拴朋,张德园.基于关键帧的人体动作识别方法[J].系统仿真学报,2015,27(10):2401-2408.]提出了一个基于关键帧的骨架特征的人体动作识别方法。该方法采用K-均值聚类算法提取人体动作视频序列中的关键帧及两种特征,并利用SVM分类器对动作序列进行分类。文献[秦勤,李艳玮.基于DSP的人体手势动作实时识别系统[J].电子技术应用,2014,40(7):75-78.]提出了一种基于DSP的便携式人体手势动作实时识别系统,采用了小波包主元分析和线性判别分析(Linear Discriminant Analysis,LDA)相结合的策略。以上方法均在人体动作识别方面达到了一定的精准度及效率。但是VR多媒体艺术场景下的人体动作更加复杂、变化更不规律,导致动作数据是海量的、高维的(非线性特征信息),所以其空间特征提取需要在降低维数的同时尽可能多的体现各种动作类型。此外,SVM分类器参数优化还具有一步提升的空间。
发明内容
有鉴于此,本发明的目的是提出VR艺术媒体交互环境下基于线性判决和SVM的动作识别方法,能够提高VR人机交互应用中的人体动作识别准确率。
本发明采用以下方案实现:一种VR艺术媒体交互环境下基于线性判决和SVM的动作识别方法,通过非线性变换将原始训练数据样本映射到高维特征空间H,然后在H中进行线性决策分析,得到最佳分类特征向量;采用遗传算法实现SVM分类器的参数搜索优化,利用优化后的SVM分类器实现动作分类识别。
进一步地,所述通过非线性变换将原始训练数据样本映射到高维特征空间H具体为:
步骤S11:设非线性映射φ(X)将X映射到高维特征空间H,产生其中表示H中样本矢量;
步骤S12:设定核矩阵为其中,中的Fisher准则函数J(w)为:
式中,w是核空间投影向量,w=φ(X)a,a=[a1,...,aN]T,是类内散布矩阵,与的表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910419837.2/2.html,转载请声明来源钻瓜专利网。