[发明专利]三维人脸模型重建方法及装置在审
申请号: | 201810690747.2 | 申请日: | 2018-06-28 |
公开(公告)号: | CN109035388A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 户磊 | 申请(专利权)人: | 北京的卢深视科技有限公司 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06T15/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100000 北京市海淀区学院*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维人脸模型 人脸 彩色图 参数化 重建 法线方向 深度图 网格点 偏移 图片输入 系数确定 系数和 网络 学习 转化 图片 | ||
1.一种三维人脸模型重建方法,其特征在于,包括:
S1、获取待处理的人脸深度图和人脸彩色图,将所述待处理的人脸深度图和人脸彩色图输入预先训练好的粗学习网络,得到参数化三维人脸模型系数,根据所述参数化三维人脸模型系数确定初始的三维人脸模型;
S2、将所述初始的三维人脸模型和人脸彩色图上的亮度值转化成4通道的UV图片,将所述UV图片输入预先训练好的细学习网络,得到待重建的三维人脸模型的各个网格点在各自法线方向上的偏移;
S3、根据所述参数化三维人脸模型系数和所述各个网格点在各自法线方向上的偏移重建三维人脸模型。
2.根据权利要求1所述的方法,其特征在于,在所述S1之前,还包括:
训练所述粗学习网络,其中,所述粗学习网络的loss函数为:
上式中wcol,wlan,wreg,wflo,wsam用来调节各项的权重,
Egeo(χ)=wpp×Epp(χ)+wps×Eps(χ),
χ={αid,αexp,αalb,z,pitch,yaw,roll,t,γ}表示参数化三维人脸模型系数,其中,αid指身份基系数,αexp指表情基系数,αalb指反射率基系数,pitch代表围绕X轴旋转的欧拉角,yaw代表围绕Y轴旋转的欧拉角,roll代表围绕Z轴旋转的欧拉角,t=(tx,ty,tz)指平移向量,tx、ty和tz分别表示X轴、Y轴和Z轴上的平移量,γ=(γr,γg,γb),γr、γg和γb分别表示图片在r、g和b通道上的光照系数,
wpp和wps用于调节权重,
F表示由三维模型投影到图片上后确定的人脸区域,psyn(m)是像素点m对应的三维网格点坐标,preal(m′)是点云上距离psyn(m)最近一个点的三维坐标,m′表示该点在深度图上的位置,是深度图上m′处的单位法向量,
Isyn(m)表示像素点m处的合成纹理,Ireal(m)表示彩色图上像素点m处的实际纹理,
L表示所有当前可见关键点编号的集合,qi表示彩色图上检测到的第i个关键点的图像坐标,pi表示重建模型上对应qi的三维关键点的三维坐标,R为旋转矩阵,∏表示透视投影,
αid,j和σid,j分别为第j个身份基的系数、第j个身份基的特征值,J为身份基的个数,αalb,k和σalb,k分别为第k个反射率基的系数、第k个反射率基的特征值,K为反射率基的个数,αexp,m和σexp,m分别为第j个表情基的系数、第j个表情基的特征值,M为表情基的个数,
p表示了像素点m对应三维点在三维模型上的相对位置信息,Projn(p)是根据第n帧参数化模型系数χn里的(αid,αexp,z)计算出三维模型形状后,再根据第n帧参数化模型系数χn里的姿态信息(pitch,yaw,roll,t)投影后计算出来的在图像平面里的位置,f(m)是像素点m从第n-1帧图片上的位置移动到第n帧图片上的位置的光流。
这里χn1,χn2分别表示同一个人第n1帧照片、第n2帧照片对应的参数化模型系数,
αid,n1,αid,n2分别表示同一个人第n1帧照片、第n2帧照片对应的身份基系数,αalb,n1,αalb,n2分别表示同一个人第n1帧照片、第n2帧照片对应的反射率基系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京的卢深视科技有限公司,未经北京的卢深视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810690747.2/1.html,转载请声明来源钻瓜专利网。