[发明专利]面部角度表示和标注方法、装置及计算机存储介质在审
申请号: | 202010085400.2 | 申请日: | 2020-02-10 |
公开(公告)号: | CN111325123A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 冯子勇;许慎;褚宗成;张德兵;邓亚峰 | 申请(专利权)人: | 北京格灵深瞳信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 马军芳;张艳 |
地址: | 100192 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面部 角度 表示 标注 方法 装置 计算机 存储 介质 | ||
面部角度表示和标注方法、装置及计算机存储介质,包括:确定面部角度的表示数据q;其中,所述表示数据q为四元数,q=e0+e1i+e2j+e3k,i2=j2=k2=ijk=‑1,e0称为q的实部,e1i+e2j+e3k称为q的虚部;将所述表示数据q进行三维可视化。采用本申请中的方案,解决了现有技术中因为欧拉角表示人脸角度导致的旋转次序不明、坐标轴是否旋转不明和万向锁等问题,能够提供更准确的面部角度标注,提高面部角度识别网络的识别精度。
技术领域
本申请涉及人脸识别技术,具体地,涉及一种面部角度表示和标注方法、装置及计算机存储介质、电子设备。
背景技术
人脸角度识别主要应用于人脸识别前的质量过滤和挑选、驾驶员状态监控等场景。在传统机器学习方法中,通常是利用人脸的关键点和标准关键点的三维几何关系,通过OpenCV中的solvePNP函数迭代求解出人脸角度。在深度学习兴起后,越来越多的使用深度卷积网络直接求人脸角度。
在学术界和工业界,人脸角度表示沿用物体旋转的表示方式,一般用三个欧拉角:偏航角(yaw)、俯仰角(pitch)和翻滚角(roll)表示。如图1所示,偏航角表示左右摇头,俯仰角表示上下点头,翻滚角表示歪头。
一般地,训练深度卷积网络需要大量的标注数据,如ImageNet数据量超过1400万,因此,训练人脸角度网络也需要人工标注大量的人脸角度数据。
使用欧拉角表示人脸角度有三个缺点:
1.需要指定旋转轴和旋转次序,因此一共有12种不同的旋转次序,给出三个欧拉角时必须同时给出旋转次序,但旋转次序很容易被忽略。人脸角度采用的次序一般为卡尔丹角,Roll-Pitch-Yaw。
2.需要约定坐标轴是否随人脸旋转,一般旋转时坐标轴随人脸一起旋转,则称为自身坐标,旋转时坐标轴固定不动则称为空间坐标。如果只给出三个欧拉角和旋转次序,而不给定坐标轴是否旋转,得到的角度表示是有歧义的。
3.欧拉角存在万向锁现象。三个欧拉角中,如果第二个欧拉角旋转使得第一个旋转轴和第三个旋转轴重合,这样使得旋转的自由度由三变为二。以卡尔丹角为例,如果Pitch为±π/2,则Roll和Yaw的则合并为一个自由度。因此用欧拉角表示人脸角度会因为万向锁而导致有歧义的表示。
现有技术中存在的问题:
采用欧拉角来表示人脸角度容易产生歧义进而导致人脸角度识别精度较低。
发明内容
本申请实施例中提供了一种面部角度表示和标注方法、装置及计算机存储介质、电子设备,以在一定程度上缓解上述技术问题。
根据本申请实施例的第一个方面,提供了一种面部角度表示方法,包括如下步骤:
确定面部角度的表示数据q;其中,所述表示数据q为四元数,q=e0+e1i+e2j+e3k,i2=j2=k2=ijk=-1,e0称为q的实部,e1i+e2j+e3k称为q的虚部;
将所述表示数据q进行三维可视化。
根据本申请实施例的第二个方面,提供了一种面部角度表示装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京格灵深瞳信息技术有限公司,未经北京格灵深瞳信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010085400.2/2.html,转载请声明来源钻瓜专利网。