[发明专利]一种用于计算机图形图像处理的、基于深度信息的实时三维人脸建模方法在审

专利信息
申请号: 201410346047.3 申请日: 2014-07-20
公开(公告)号: CN104077808A 公开(公告)日: 2014-10-01
发明(设计)人: 詹曙;常乐乐 申请(专利权)人: 詹曙;常乐乐
主分类号: G06T17/00 分类号: G06T17/00;G06T7/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种从深度信息直接进行实时三维人脸建模的方法,本发明没有采用先前任何标准人脸模型,而是通过配准和集成多幅人脸深度图进行直接三维实时建模。其步骤包括:系统的搭建及从kinect获取的深度信息;将深度图中的人脸分割出来;进行反投影形成三维点云;进行滤波、配准、集成、绘制及显示。采用本发明,只需要用户坐在kinect前,即可快速生成用户所需的三维实时人脸模型,极大地降低以往用激光扫描进行三维人脸建模的成本和制作时间而且也避免了用二维图像进行三维人脸建模带来的误差,以较低的成本实现了三维实时人脸建模。
搜索关键词: 一种 用于 计算机 图形图像 处理 基于 深度 信息 实时 三维 建模 方法
【主权项】:
一种用于于计算机图形图像处理的、基于深度信息的实时三维人脸建模方法,其特征权利在于,该方法的步骤如下:(1)数据的获取:用户坐在kinect正前方0.5米左右处,kinect在时间τ从kinect获取一张原始的深度图Dτ,Dτ由一组像素(u,v)组成,每个像素深度值为Dτ(u,v);(2)分割:1)本方法是将深度图分为于前景区和背景区,前景区包含用户的整个身体,背景区只包含剩下的环境。使用连通分量分析确定前景区域,当两个相邻深度像素的差异低于一个临界值时被认为是相邻的。假设前景区域是距离相机最短距离的最大部分;2)为了确定头部区域,我们的方法是寻找一条水平线将前景区域分为头部区域和躯干区域,这样便可得到头部区域:<mrow><msubsup><mi>D</mi><mrow><mi>&tau;</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow><mo>&prime;</mo></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>D</mi><mi>&tau;</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mtd><mtd><mi>iff</mi></mtd><mtd><msub><mi>M</mi><mi>&tau;</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn></mtd><mtd><mi>and</mi></mtd><mtd><mi>v</mi><mo>&le;</mo><mi>s</mi></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd></mtd><mtd><mi>other</mi></mtd><mtd><mi>wise</mi></mtd><mtd></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>(3)去噪:通过kinect获得的深度图通常是有噪声的,在头发区域尤其明显,这些噪声会影响我们进行图像配准,为了提高配准将运用基于Prewitt算子的分块自适应阈值边缘检测算法可得到比较精细的图像边缘;进而根据获取边缘信息对深度图进行分类,边缘区采用单向多级中值滤波算法进行降噪处理,而非边缘区采用双向多级中值滤波算法进行降噪处理。最终利用Kinect得到边缘清晰,噪声较小的高质量深度图:<mrow><msubsup><mi>D</mi><mrow><mi>&tau;</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msubsup><mi>D</mi><mi>&tau;</mi><mo>&prime;</mo></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mtd><mtd><mi>iff</mi></mtd><mtd><mi>&sigma;</mi><msup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mn>2</mn></msup><mo>&le;</mo><msubsup><mi>&sigma;</mi><mi>max</mi><mn>2</mn></msubsup></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>other</mi></mtd><mtd><mi>wise</mi></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>(4)反投影:为了对多幅深度图进行配准,首先讲深度图进行反投影形成一个三维点云,然后评估每一个顶点的表面法向量。通过反投影我们产生了一个顶点贴图Vτ:Vτ(u,v)=D″τ(u,v)K‑1[u,v,‑1]T    (3)每个顶点法向量可由相邻顶点的叉积进行评估:Nτ(u,v)=[Vτ(u+1,v)‑Vτ(u,v)]×[Vτ(u,v+1)‑Vτ(u,v)]    (4)(5)配准:为了得到一个三维人脸模型,需要校准一些顶点贴图,对于每个顶点贴图,需要确定一个刚体变换矩阵<mrow><msub><mi>T</mi><mrow><mi>g</mi><mo>,</mo><mi>&tau;</mi></mrow></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>R</mi><mrow><mi>g</mi><mo>,</mo><mi>&tau;</mi></mrow></msub></mtd><mtd><msub><mi>t</mi><mrow><mi>g</mi><mo>,</mo><mi>&tau;</mi></mrow></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>I</mi></mtd></mtr></mtable></mfenced></mrow>将顶点和法向量转换到一个全局坐标空间中去,为了计算用于配准三维点云的刚体变换矩阵,我们使用基于kd‑tree加速的icp算法来求解;(6)集成:在上述步骤都完成后,将处理后的多幅深度图进行集成便形成了一个三维人脸模型。一个立体空间被用于建立人脸模型,这个立体空间只有人头的大小。立体空间为521×512×512三维空间,每一个立体像素p包含一个权值w(p)和一个符号距离f(p),符号距离只有在一个表面附近才准确,所以他们会被截断以阻止表面间的相互干扰。这样每个被分割的深度图像D″τ(u,v)逐渐融合成立体模型;其中<mrow><mi>f</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>&LeftArrow;</mo><mfrac><mrow><mi>w</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mi>f</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mi>&tau;</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><msub><mi>f</mi><mi>&tau;</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></mrow><mrow><mi>w</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mi>f</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>wτ(p)和fτ(p)分别为增量权值和增量符号距离,为了确定wτ(p)和fτ(p),立体像素p被映射到深度图中,而符号距离是通过从深度测量值中减去立体像素的深度值被计算的:<mrow><msub><mi>S</mi><mi>p</mi></msub><mo>=</mo><msubsup><mi>D</mi><mi>&tau;</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>-</mo><mfrac><msub><mrow><mo>|</mo><mo>|</mo><msup><msub><mi>T</mi><mrow><mi>g</mi><mo>,</mo><mi>&tau;</mi></mrow></msub><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>p</mi><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub><msub><mrow><mo>|</mo><mo>|</mo><msup><mi>K</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><msup><mrow><mo>[</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>,</mo><mn>1</mn><mo>]</mo></mrow><mi>T</mi></msup><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>并得到<mrow><msub><mi>f</mi><mi>&tau;</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mi>sign</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>p</mi></msub><mo>)</mo></mrow><mi>min</mi><mrow><mo>(</mo><mn>1</mn><mo>,</mo><mfrac><mrow><mo>|</mo><msub><mi>S</mi><mi>p</mi></msub><mo>|</mo></mrow><mi>u</mi></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>(7)描绘:由于在配准时,可能会有多幅深度图在相同部位都会有空洞,尤其是在人头的边缘部分如头发耳朵及脸部边缘,这样在集成后形成的三维模型可能还是会有空洞,模型建的并不完整,所以我们在将多幅图进行集成前要对相同部位具有空洞的地方进行插值,这里我们使用三次卷积法进行插值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于詹曙;常乐乐,未经詹曙;常乐乐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410346047.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top