[发明专利]一种针对视线估计的鲁棒混合回归方法在审

申请号：	201610330955.2	申请日：	2016-05-18
公开（公告）号：	CN106056039A	公开（公告）日：	2016-10-26
发明（设计）人：	潘力立;王正宁;郑亚莉	申请（专利权）人：	电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	电子科技大学专利中心 51203	代理人：	张杨
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种针对视线估计的鲁棒混合回归方法，属于计算机视觉技术领域，涉及鲁棒混合回归方法，主要解决视线估计和视线跟踪等视觉映射问题，可以应用于汽车安全驾驶和感兴趣区域检测等领域。首先对采集到的眼部图像进行大小归一化；之后，在输入眼部图像梯度方向直方图特征和对应视线之间建立混合回归模型；接着，初始化混合回归模型的聚类中心，根据初始化聚类中心划分分组，并求解回归参数；最后，对待估计眼部图像提取梯度方向直方图特征，并利用已学到的鲁棒混合回归模型估计头部姿态。
搜索关键词：	一种针对视线估计混合回归方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种针对视线估计的鲁棒混合回归方法，包括以下步骤：步骤1：采集N幅包含不同视线的眼部图像，并记录采集每幅图像时对应的视线方向y_n的第一维表示水平方向，第二维表示垂直方向，下标n表示第n幅图像对应的视线方向；步骤2：将步骤1中采集的眼部图像归一化为大小为100×60像素，并提取梯度方向直方图特征；在梯度方向直方图特征计算的过程中，区域个数的参数设置为2×2，每一区域中图像单元的个数参数设置为8×8，方向柱的个数设置为9，最后得到任意一幅图像对应的梯度方向直方图特征的维数为4086，并记任意第n幅图像对应的梯度方向直方图特征向量步骤3：将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X，即X＝[x₁,x₂,…,x_N]；步骤4：将N幅图像对应的视线方向向量按顺序排列为数据矩阵Y，即Y＝[y₁,y₂,…,y_N]；步骤5：假设在视线估计问题中，所有输入特征和输出视线方向联合服从混合高斯分布，因此任一输入输出观测对{x_n,y_n}的概率分布为：各高斯分布中心、协方差和混合系数，分别用符号μ_k，∑_k和π_k表示，其中下角标k表示第k个高斯分布，k＝1,2,…K；为隐变量，决定第n个观测样本{x_n,y_n}属于哪一个高斯，Θ表示此混合回归模型中的所有参数；同时，假设已知{x_n,y_n}属于某一高斯的条件下，输入与输出之间存在线性回归关系，回归参数为参数矩阵A_k，偏差向量b_k和噪声方差水平γ_k，即：其中为单位矩阵。根据上述假设，最后令Θ＝{μ_k,∑_k,π_k,A_k,b_k,γ_k}代表参数集合。另外，由上述假设可以推断输入梯度方向直方图特征也分别服从混合高斯分布，即：其中表示输入特征的各高斯分布中心和协方差。由输入和输出之间的线性关系，可知：

<mrow><msub><mi>μ</mi><mi>k</mi></msub><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><msubsup><mi>μ</mi><mi>k</mi><mi>x</mi></msubsup></mtd></mtr><mtr><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mi>μ</mi><mi>k</mi><mi>x</mi></msubsup><mo>+</mo><msub><mi>b</mi><mi>k</mi></msub></mrow></mtd></mtr></mtable></mfenced><mo>,</mo><msub><mo>Σ</mo><mi>k</mi></msub><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><msubsup><mo>Σ</mo><mi>k</mi><mi>x</mi></msubsup></mtd><mtd><mrow><msubsup><mo>Σ</mo><mi>k</mi><mi>x</mi></msubsup><msub><mi>A</mi><mi>k</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mo>Σ</mo><mi>k</mi><mi>x</mi></msubsup></mrow></mtd><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mo>Σ</mo><mi>k</mi><mi>x</mi></msubsup><msub><mi>A</mi><mi>k</mi></msub><mo>+</mo><msub><mi>γ</mi><mi>k</mi></msub><msub><mi>I</mi><mn>2</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>

步骤6：为了提高混合回归模型的鲁棒性，假设上述聚类可以归为不同的L个分组,即这里代表属于第l个组的聚类标号集合；并假设同组聚类对应的回归参数A_k有相同的先验假设，即：其中表示高斯先验的均值，τ_lI_2D代表协方差矩阵；这样假设的依据是同一组的聚类为数据流形分布上邻近的聚类，具有相似的输入输出映射关系；同时，我们假设分组在优化的过程中学习得到，邻近的聚类归为一个组；步骤7：根据步骤5和步骤6中得到鲁棒混合回归模型的所有参数Θ，给定输入数据矩阵X和输出数据矩阵Y时的联合后验概率分布为：lnp(Θ|X,Y)∝lnp(X,Y|Θ)+lnp(Θ)将参数步骤6中的先验分布p(Θ)和步骤5中的似然函数lnp(X,Y|Θ)的具体表达式代入到上式中，可以得到参数Θ的后验分布为：步骤8：为了求解步骤8中的参数Θ，我们采用EM算法进行参数优化。EM算法包括E步骤和M步骤；E步骤：在E步中利用上一步的参数估计结果Θ^old计算任意第n个样本属于第k个聚类的后验概率符号w_kn代表此后验概率。同时建立关于参数Θ的Q函数，

<mfenced open='' close=''><mtable><mtr><mtd><mi>Q</mi><mrow><mo>(</mo><mi>Θ</mi><mo>,</mo><msup><mi>Θ</mi><mi>old</mi></msup><mo>)</mo></mrow><mo>=</mo><munder><mi>Σ</mi><mi>Z</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>Z</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>,</mo><msup><mi>Θ</mi><mi>old</mi></msup><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>Y</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Z</mi><mo>,</mo><mi>Θ</mi><mo>)</mo></mrow><mo>+</mo><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>Θ</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mo>+</mo><munder><mi>Σ</mi><mi>Z</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>Z</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>,</mo><msup><mi>Θ</mi><mi>old</mi></msup><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Z</mi><mo>|</mo><mi>Θ</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced>

其中为隐含变量矩阵，其第k行n列的元素为z_kn；M步骤：最大化Q函数Q(Θ,Θ^old)来更新参数Θ，根据上式的第一行得到关于回归参数的优化目标函数λ>0为回归噪声方差水平γ_k和参数τ_l之间的比值，这里假设同一组的子回归器有相同的回归噪声水平γ_k；上述目标式可以进一步转化为：

<mrow><munder><mi>min</mi><mrow><mover><mi>A</mi><mo>~</mo></mover><mo>,</mo><mi>G</mi><mo>:</mo><msup><mi>G</mi><mi>T</mi></msup><mi>G</mi><mo>=</mo><msub><mi>I</mi><mi>L</mi></msub></mrow></munder><munderover><mi>Σ</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mi>kn</mi></msub><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>nk</mi></msub><mo>-</mo><mrow><mo>(</mo><msub><mi>I</mi><mn>2</mn></msub><mo>&CircleTimes;</mo><msubsup><mi>x</mi><mi>n</mi><mi>T</mi></msubsup><mo>)</mo></mrow><msub><mover><mi>a</mi><mo>~</mo></mover><mi>k</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>λtr</mi><mrow><mo>(</mo><mover><mi>A</mi><mo>~</mo></mover><mrow><mo>(</mo><msub><mi>I</mi><mi>K</mi></msub><mo>-</mo><msup><mi>GG</mi><mi>T</mi></msup><mo>)</mo></mrow><msup><mover><mi>A</mi><mo>~</mo></mover><mi>T</mi></msup><mo>)</mo></mrow></mrow>

这里为单位矩阵，为所有回归参数构成的参数矩阵，为为偏差向量b_k前一次的取值，分组矩阵的第k行l列元素g_kl指示第k个子回归器是否属于第l个分组，表示否则g_kl＝0；在上述目标函数中，将对分组矩阵G的约束松弛为G:G^TG＝I_L；令M＝GG^T，并固定得到求解M的目标函数：其中符号代表对称的半正定矩阵集合，通过特征值分解可以得到M的解。根据上面求得的M＝GG^T的值，得到{A_k}和{b_k}的解分别为：