[发明专利]一种针对视线估计的鲁棒混合回归方法在审

专利信息
申请号: 201610330955.2 申请日: 2016-05-18
公开(公告)号: CN106056039A 公开(公告)日: 2016-10-26
发明(设计)人: 潘力立;王正宁;郑亚莉 申请(专利权)人: 电子科技大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 电子科技大学专利中心 51203 代理人: 张杨
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种针对视线估计的鲁棒混合回归方法,属于计算机视觉技术领域,涉及鲁棒混合回归方法,主要解决视线估计和视线跟踪等视觉映射问题,可以应用于汽车安全驾驶和感兴趣区域检测等领域。首先对采集到的眼部图像进行大小归一化;之后,在输入眼部图像梯度方向直方图特征和对应视线之间建立混合回归模型;接着,初始化混合回归模型的聚类中心,根据初始化聚类中心划分分组,并求解回归参数;最后,对待估计眼部图像提取梯度方向直方图特征,并利用已学到的鲁棒混合回归模型估计头部姿态。
搜索关键词: 一种 针对 视线 估计 混合 回归 方法
【主权项】:
一种针对视线估计的鲁棒混合回归方法,包括以下步骤:步骤1:采集N幅包含不同视线的眼部图像,并记录采集每幅图像时对应的视线方向yn的第一维表示水平方向,第二维表示垂直方向,下标n表示第n幅图像对应的视线方向;步骤2:将步骤1中采集的眼部图像归一化为大小为100×60像素,并提取梯度方向直方图特征;在梯度方向直方图特征计算的过程中,区域个数的参数设置为2×2,每一区域中图像单元的个数参数设置为8×8,方向柱的个数设置为9,最后得到任意一幅图像对应的梯度方向直方图特征的维数为4086,并记任意第n幅图像对应的梯度方向直方图特征向量步骤3:将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,…,xN];步骤4:将N幅图像对应的视线方向向量按顺序排列为数据矩阵Y,即Y=[y1,y2,…,yN];步骤5:假设在视线估计问题中,所有输入特征和输出视线方向联合服从混合高斯分布,因此任一输入输出观测对{xn,yn}的概率分布为:各高斯分布中心、协方差和混合系数,分别用符号μk,∑k和πk表示,其中下角标k表示第k个高斯分布,k=1,2,…K;为隐变量,决定第n个观测样本{xn,yn}属于哪一个高斯,Θ表示此混合回归模型中的所有参数;同时,假设已知{xn,yn}属于某一高斯的条件下,输入与输出之间存在线性回归关系,回归参数为参数矩阵Ak,偏差向量bk和噪声方差水平γk,即:其中为单位矩阵。根据上述假设,最后令Θ={μk,∑kk,Ak,bkk}代表参数集合。另外,由上述假设可以推断输入梯度方向直方图特征也分别服从混合高斯分布,即:其中表示输入特征的各高斯分布中心和协方差。由输入和输出之间的线性关系,可知:<mrow><msub><mi>&mu;</mi><mi>k</mi></msub><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><msubsup><mi>&mu;</mi><mi>k</mi><mi>x</mi></msubsup></mtd></mtr><mtr><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mi>&mu;</mi><mi>k</mi><mi>x</mi></msubsup><mo>+</mo><msub><mi>b</mi><mi>k</mi></msub></mrow></mtd></mtr></mtable></mfenced><mo>,</mo><msub><mo>&Sigma;</mo><mi>k</mi></msub><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><msubsup><mo>&Sigma;</mo><mi>k</mi><mi>x</mi></msubsup></mtd><mtd><mrow><msubsup><mo>&Sigma;</mo><mi>k</mi><mi>x</mi></msubsup><msub><mi>A</mi><mi>k</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mo>&Sigma;</mo><mi>k</mi><mi>x</mi></msubsup></mrow></mtd><mtd><mrow><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msubsup><mo>&Sigma;</mo><mi>k</mi><mi>x</mi></msubsup><msub><mi>A</mi><mi>k</mi></msub><mo>+</mo><msub><mi>&gamma;</mi><mi>k</mi></msub><msub><mi>I</mi><mn>2</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>步骤6:为了提高混合回归模型的鲁棒性,假设上述聚类可以归为不同的L个分组,即这里代表属于第l个组的聚类标号集合;并假设同组聚类对应的回归参数Ak有相同的先验假设,即:其中表示高斯先验的均值,τlI2D代表协方差矩阵;这样假设的依据是同一组的聚类为数据流形分布上邻近的聚类,具有相似的输入输出映射关系;同时,我们假设分组在优化的过程中学习得到,邻近的聚类归为一个组;步骤7:根据步骤5和步骤6中得到鲁棒混合回归模型的所有参数Θ,给定输入数据矩阵X和输出数据矩阵Y时的联合后验概率分布为:lnp(Θ|X,Y)∝lnp(X,Y|Θ)+lnp(Θ)将参数步骤6中的先验分布p(Θ)和步骤5中的似然函数lnp(X,Y|Θ)的具体表达式代入到上式中,可以得到参数Θ的后验分布为:步骤8:为了求解步骤8中的参数Θ,我们采用EM算法进行参数优化。EM算法包括E步骤和M步骤;E步骤:在E步中利用上一步的参数估计结果Θold计算任意第n个样本属于第k个聚类的后验概率符号wkn代表此后验概率。同时建立关于参数Θ的Q函数,<mfenced open='' close=''><mtable><mtr><mtd><mi>Q</mi><mrow><mo>(</mo><mi>&Theta;</mi><mo>,</mo><msup><mi>&Theta;</mi><mi>old</mi></msup><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mi>Z</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>Z</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>,</mo><msup><mi>&Theta;</mi><mi>old</mi></msup><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>Y</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Z</mi><mo>,</mo><mi>&Theta;</mi><mo>)</mo></mrow><mo>+</mo><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>&Theta;</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mo>+</mo><munder><mi>&Sigma;</mi><mi>Z</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>Z</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>,</mo><msup><mi>&Theta;</mi><mi>old</mi></msup><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Z</mi><mo>|</mo><mi>&Theta;</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced>其中为隐含变量矩阵,其第k行n列的元素为zkn;M步骤:最大化Q函数Q(Θ,Θold)来更新参数Θ,根据上式的第一行得到关于回归参数的优化目标函数λ>0为回归噪声方差水平γk和参数τl之间的比值,这里假设同一组的子回归器有相同的回归噪声水平γk;上述目标式可以进一步转化为:<mrow><munder><mi>min</mi><mrow><mover><mi>A</mi><mo>~</mo></mover><mo>,</mo><mi>G</mi><mo>:</mo><msup><mi>G</mi><mi>T</mi></msup><mi>G</mi><mo>=</mo><msub><mi>I</mi><mi>L</mi></msub></mrow></munder><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mi>kn</mi></msub><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>nk</mi></msub><mo>-</mo><mrow><mo>(</mo><msub><mi>I</mi><mn>2</mn></msub><mo>&CircleTimes;</mo><msubsup><mi>x</mi><mi>n</mi><mi>T</mi></msubsup><mo>)</mo></mrow><msub><mover><mi>a</mi><mo>~</mo></mover><mi>k</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;tr</mi><mrow><mo>(</mo><mover><mi>A</mi><mo>~</mo></mover><mrow><mo>(</mo><msub><mi>I</mi><mi>K</mi></msub><mo>-</mo><msup><mi>GG</mi><mi>T</mi></msup><mo>)</mo></mrow><msup><mover><mi>A</mi><mo>~</mo></mover><mi>T</mi></msup><mo>)</mo></mrow></mrow>这里为单位矩阵,为所有回归参数构成的参数矩阵,为偏差向量bk前一次的取值,分组矩阵的第k行l列元素gkl指示第k个子回归器是否属于第l个分组,表示否则gkl=0;在上述目标函数中,将对分组矩阵G的约束松弛为G:GTG=IL;令M=GGT,并固定得到求解M的目标函数:其中符号代表对称的半正定矩阵集合,通过特征值分解可以得到M的解。根据上面求得的M=GGT的值,得到{Ak}和{bk}的解分别为:<mrow><mi>v</mi><mi>e</mi><mi>c</mi><mrow><mo>(</mo><mover><mi>A</mi><mo>~</mo></mover><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>&lsqb;</mo><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>X</mi><mi>n</mi><mi>T</mi></msubsup><msub><mi>W</mi><mi>n</mi></msub><msub><mi>X</mi><mi>n</mi></msub><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><msub><mi>I</mi><mrow><mn>2</mn><mi>K</mi><mi>D</mi></mrow></msub><mo>-</mo><msup><mi>GG</mi><mi>T</mi></msup><mo>&CircleTimes;</mo><msub><mi>I</mi><mrow><mn>2</mn><mi>D</mi></mrow></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>X</mi><mi>n</mi><mi>T</mi></msubsup><msub><mi>W</mi><mi>n</mi></msub><msub><mover><mi>y</mi><mo>^</mo></mover><mi>n</mi></msub></mrow><mrow><msub><mi>b</mi><mi>k</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>w</mi><mrow><mi>k</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>n</mi></msub><mo>-</mo><msubsup><mi>A</mi><mi>k</mi><mi>T</mi></msubsup><msub><mi>x</mi><mi>n</mi></msub><mo>)</mo></mrow></mrow>其中为单位矩阵,由训练样本输入特征构成的矩阵根据Q函数第二行可以得到关于聚类参数的目标函数最后得到解为:<mrow><msubsup><mi>&mu;</mi><mi>k</mi><mi>x</mi></msubsup><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>w</mi><mrow><mi>k</mi><mi>n</mi></mrow></msub><msub><mi>x</mi><mi>n</mi></msub></mrow><mrow><msubsup><mo>&Sigma;</mo><mi>k</mi><mi>x</mi></msubsup><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>w</mi><mrow><mi>k</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>n</mi></msub><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mi>x</mi></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>n</mi></msub><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mi>x</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mrow><mrow><msub><mi>&pi;</mi><mi>k</mi></msub><mo>=</mo><mfrac><msub><mi>N</mi><mi>k</mi></msub><mi>N</mi></mfrac></mrow>步骤9:一直重复步骤9中的E步和M步,直到收敛,即:前后两次参数的值不再改变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610330955.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top