[发明专利]一种基于栈式自编码的头部姿态估计方法有效
申请号: | 201611100343.0 | 申请日: | 2016-12-05 |
公开(公告)号: | CN106599810B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 潘力立 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 张杨 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 头部 姿态 估计 方法 | ||
该发明公开了一种基于栈式自编码的头部姿态估计方法,该发明属于计算机视觉技术领域。主要思想是提出利用栈式自编码器,建立头部深度图像和姿态之间的非线性映射关系。本发明首先采集大量头部深度图像作为训练样本,同时提取梯度方向直方图特征,然后记录对应的头部姿态。之后,设计栈式自编码器,在训练样本和标定姿态数据上,利用梯度下降法学习栈式自编码器的各层参数。最后,对于待估计姿态的头部图像,提取梯度方向直方图特征,根据上述已学习的栈式自编码器估计头部姿态。与传统的头部姿态估计方法相比,该方法能够模拟输入特征到头部姿态的复杂映射关系,有效的克服了浅层模型估计准确性不高的问题。
技术领域
本发明属于计算机视觉技术领域,涉及图像中的头部姿态估计问题。
背景技术
头部姿态估计(如图1)是指根据头部的数字图像,利用机器学习和计算机视觉的方法准确快速地估计该图像中对应头部的偏转角度,也称为头部姿态。它是近年来计算机视觉和机器学习领域研究的热门问题,在人机交互、安全驾驶和关注度分析等方面都有非常广泛的应用。例如:在人机交互领域,头部的偏转角度可以用于控制电脑或机器显示的方向和位置;在安全驾驶领域,头部姿态可用于辅助视线估计,从而提示驾驶员正确的视线方向。近年来,头部姿态估计在流形学习和子空间理论发展的基础上,有了进一步的发展。现有头部姿态估计方法可以分为三个大的类别:1.基于容貌的方法,2.基于分类的方法和3.基于回归的方法。
基于容貌的头部姿态估计方法的基本原理是将输入的头部图像与数据库中已有的图像进行一一比对,并将找到的最相似的图像所对应的角度作为待估计图像的头部姿态(即角度)。该类方法最大的缺陷在于其只能输出离散的头部偏转角度,并且由于需要与所有已有图像进行依次比对,运算量巨大。参见文献:D.J.Beymer,Face Recognition underVarying Pose,IEEE Conference on Computer Vision and Pattern Recognition,pp.756-761,1994和J.Sherrah, S.Gong,and E.J.Ong,Face Distributions inSimilarity Space under Varying Head pose Image and Vision Computing,vol.19,no.12,pp.807-819,2001。
基于分类的头部姿态估计方法是指根据输入图像的特征和对应头部偏转角度训练分类器,并利用学习好的分类器区分待估计图像头部偏转角度所属的类别,从而确定头部姿态的大致范围。该类方法中常用的分类器包括支持向量机(Support Vector Machine,SVM),线性判决分析(Linear Discriminative Analysis,LDA),核线性判决分析(KernelLinear Discriminative Analysis,KLDA),这类方法的主要缺点是无法估计输出连续的头部姿态,参见文献:J.Huang, X.Shao,and H.Wechsler,Face Pose Discrimination usingSupport Vector Machines(SVM), International Conference on PatternRecognition,pp.154-156,1998。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611100343.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:答案信息录入方法、装置及终端设备
- 下一篇:一种VR头显的面部表情追踪方法