[发明专利]声音驱动辅助侧脸图像的人脸重建方法及装置有效

申请号：	201711461073.0	申请日：	2017-12-28
公开（公告）号：	CN108230438B	公开（公告）日：	2020-06-19
发明（设计）人：	刘烨斌;苏肇祺;戴琼海	申请（专利权）人：	清华大学
主分类号：	G06T17/00	分类号：	G06T17/00;G06N3/04
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	张润
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种声音驱动辅助侧脸图像的人脸重建方法及装置，其中，方法包括：提取训练数据集；获取语音特征和表情参数的对应关系；提取每一帧对应的语音波形窗口的语音特征，并将特征信息存储到输入文件中；得到每一帧语音信息对应的人脸表情参数；获取侧脸的特征点信息，以通过深度学习方法获取侧脸图像与脸部特征点的对应关系；用已有的人脸模型拟合侧脸上的特征点位置，求解人脸的表情参数和形状参数，并将通过声音信息求解得到的表情参数引入进行加权；将拟合后的人脸模型进行纹理贴图和匹配，以获得最终的人脸重建结果。该方法可以使得较难通过侧脸图像获得的嘴部运动信息得到较好的跟踪和重建，有效提高重建的可靠性。
搜索关键词：	声音驱动辅助图像重建方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种声音驱动辅助侧脸图像的人脸重建方法，其特征在于，包括以下步骤：提取训练数据集，其中，通过AR装置佩戴者正脸面对摄像机镜头说一段语料库中的话，提取摄像机采集的声音信息并转化为语音特征，提取摄像机采集的人脸图像信息并提取表情参数，所述语音特征和所述表情参数分别作为深度学习训练集的输入和输出；对所述训练数据集使用卷积神经网络进行深度学习训练，获取所述语音特征和所述表情参数的对应关系；在测试和使用神经网络模型的过程中，通过架设在所述AR装置两侧的微型摄像机采集使用者的侧脸信息以及说话的语音信息，提取每一帧对应的语音波形窗口的语音特征，并将特征信息存储到输入文件中；将所述输入文件置入训练好的神经网络模型中，得到每一帧语音信息对应的人脸表情参数；对于侧脸信息，同样做出训练集，通过已有的正脸特征点匹配将正脸上的特征点通过标定好的相机参数映射到侧脸上，获取侧脸的特征点信息，以通过深度学习方法获取侧脸图像与脸部特征点的对应关系；用已有的人脸模型拟合侧脸上的特征点位置，求解人脸的表情参数和形状参数，并将通过声音信息求解得到的表情参数引入进行加权；以及将拟合后的人脸模型进行纹理贴图和匹配，以获得最终的人脸重建结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711461073.0/，转载请声明来源钻瓜专利网。

上一篇：场景重建方法和装置、电子设备、程序和介质
下一篇：一种用于web端三维模型轻量化方法、电子设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T17-00 用于计算机制图的3D建模
G06T17-05 .地理模型
G06T17-10 .体积绘图，例如：圆柱体、六面体或使用结构实体几何
G06T17-20 .线框绘图，例如：多边法或镶嵌
G06T17-30 .表面绘图，例如：多项式表面绘图

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音驱动辅助侧脸图像的人脸重建方法及装置有效

专利文献下载