[发明专利]基于标记分布的解决类别缺失问题的头部姿态估计方法在审
申请号: | 201611107604.1 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106599815A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 耿新;霍增炜 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/48;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 唐红 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标记 分布 解决 类别 缺失 问题 头部 姿态 估计 方法 | ||
技术领域
本发明属于模式识别和机器学习技术,具体涉及一种基于标记分布的解决类别缺失问题的头部姿态估计方法。
背景技术
头部姿态估计是给定一幅人脸图像,估计出该图像中头部的偏转角度。头部姿态估计有着非常重要的应用,如在人机交互中,智能机器通过估计头部姿态的变化做出不同的决策,人可以通过头部姿态对计算机直接下达命令。在车辆安全驾驶中,可以根据驾驶员头部姿态的变化判断其是否疲劳驾驶,从而避免事故的发生。除了这些,头部姿态估计可以为其他计算机视觉问题提供重要的预处理,如人脸识别,人脸表情识别等计算机视觉问题可能需要事先知道头部的姿态,这样可以提高此类问题的精度。
类别缺失问题是指在训练时没有某些类别的样本,通过特定的算法学习这些类别。常见的类别缺失问题有物体识别,自然界中有非常多的物体,我们无法对每一种物体训练模型,但是可以通过对一些物体进行学习,来预测新类别的物体,通常的做法是利用一些属性信息来进行学习。比如,对一幅图像进行分析,发现这张图像中反映出“灰色巨大的动物”以及“长长的鼻子”这两种属性,那么我们可以初步断定图像中是大象,即使我们从来没有对大象进行建模。这种基于属性的方法在类别缺失问题中非常的常见。
在头部姿态估计中,理论上,因为转动的角度是连续的,我们有无数种头部姿态,但是在实际中,我们无法利用所有的头部姿态,只能利用其中的一部分。因此,类别缺失问题在头部姿态中是很普遍的。并且,针对头部姿态估计的类别缺失问题,无法利用一些属性信息来进行学习,因为头部姿态这种有序的类别并没有特别的属性,往往都是数值。。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于标记分布的解决类别缺失问题的头部姿态估计方法,通过使用标记分布的方法,利用标记间的相关性,可以很好地解决现有缺陷。
技术方案:本发明的一种基于标记分布的解决类别缺失问题的头部姿态估计方法,包括如下步骤:
(1)获取用于训练的头部姿态的图像数据集,该图像数据集中缺少某些姿态的样本,对该图像数据集中的图像进行预处理,即将数据集中的每幅图像的人脸部分裁剪出来,裁剪掉头发、脖子以及背景部分,使得图像中只剩下人脸;
(2)将步骤(1)中得到裁剪后的人脸图像缩放到统一大小的分辨率(例如64×64像素);
(3)从步骤(2)中得到的人脸图像中提取图像特征向量,例如可以采用层次梯度直方图方法;
(4)收集每幅图像对应的类别信息(即头部姿态信息),根据每幅图像的类别信息(头部姿态)以及类别之间的关系(头部姿态类别差异可以量化,如:30°与20°相比,与40°的相似程度更大),给予每幅图像一个标记分布,该标记分布用向量表示,然后将该标记分布向量作为训练中所需的图像的监督信息,该监督信息表示每种姿态与人脸图像的关系;
(5)使用人脸图像特征向量及其标记分布作为训练集,将最大熵模型产生的标记分布、根据类别生成的标记分布的Jeffrey散度以及参数向量的平滑正则项作为目标函数,对该目标函数进行优化,训练得到可以用于头部姿态估计的参数模型,即使用最大熵模型作为头部姿态估计的参数模型;
(6)将待测的头部姿态图像经过步骤(1)中的裁剪人脸,然后使用步骤(2)和(3)中的方法提取出图像的特征向量,接着使用步骤(5)中训练出来的参数模型计算得到一个向量,所述向量表示各个类别对该图像的描述度,选择所述向量中最大的描述度对应的类别作为该图像的头部姿态。
进一步的,所述步骤(5)中,在所述目标函数中加入关于参数的平滑正则项使预测出的标记分布更加平滑,同时通过平滑正则项来加强对缺失类别的学习;然后使用l-bfgs优化方法作为最小化目标函数的参数优化方法。
进一步的,在步骤(6)中,进行头部姿态估计时,先计算出标记分布向量,然后得到对应的头部姿态。
有益效果:本发明可以快速、有效地训练出用于头部姿态估计的模型,利用该方法可以对新类别的人脸图像进行头部姿态估计,并且不需要额外的属性信息。
附图说明
图1为本发明的流程图;
图2为实施例中人脸裁剪示例图;
图3为实施例中二维头部姿态的邻居示例图;
图4为实施例中二维头部姿态标记分布的示例图;
其中,2(a)为人脸的左视图,2(b)为人脸的主视图,2(c)为人脸的右视图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611107604.1/2.html,转载请声明来源钻瓜专利网。