[发明专利]一种人脸检测方法及装置在审
申请号: | 201610848895.3 | 申请日: | 2016-09-23 |
公开(公告)号: | CN107871134A | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 段旭;宋丽;张祥德 | 申请(专利权)人: | 北京眼神科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 | ||
技术领域
本发明实施例涉及人工智能领域,尤其涉及一种人脸检测方法及装置。
背景技术
人脸检测是指从输入区域中确定所有人脸的位置和大小的过程。作为人脸信息处理中的一项关键技术,人脸检测是许多自动人脸图像分析应用的前提和基础,如人脸识别、人脸配准、人脸追踪、人脸属性识别等,也是现代人机交互系统的第一步。不仅如此,目前大多数的数码相机都嵌入了人脸检测技术来自动对焦,许多社交网络如FaceBook等利用人脸检测技术来实现图像标注。
随着人工智能的发展,人脸检测方法也得到了一定的发展,但仍存在一些不足。如基于提升级联的方法,虽然采用单一的积分图特征的级联检测器计算速度较快,但仅能够处理正面人脸图像,对于姿态变化、部分遮挡和光照等复杂条件下的人脸检测性能较差;基于可变部件模型技术的方法,虽然检测性能较好,能够在人脸部分被遮挡的情况下检测到人脸,但由于需要训练一个隐支持向量机分类器来找到这些部件以及部件之间的几何关系,计算成本较高,导致计算比较耗时。
因此,如何在保证计算速度的同时提升人脸检测的检测性能,是目前亟待解决的技术问题。
发明内容
本发明实施例提供一种人脸检测方法,以解决现有技术中人脸检测的检测性能和计算速度无法同时满足用户需求的问题。
为了解决上述问题,本发明公开了一种人脸检测方法,包括:
采用预先训练的第一卷积神经网络模型对待测图像进行分类处理,确定所述待测图像中各输入区域的第一人脸置信度,根据所述第一人脸置信度从所述输入区域中筛选出至少一个候选区域,所述第一卷积神经网络包括m层卷积层;
采用预先训练的第二卷积神经网络模型分别对所述候选区域进行分类处理,确定所述候选区域的第二人脸置信度,根据所述第二人脸置信度筛选出至少一个选中区域,所述第二卷积神经网络包括k层卷积层,其中,k和m均为正整数且k大于m;
根据所选出的至少一个选中区域,进行检测框消除和聚合,以得到人脸检测结果。
其中,采用预先训练的第一卷积神经网络模型对待测图像进行分类处理之前,还包括:当采用图像金字塔方法从所述待测图像中获取输入区域时,将预先训练的第一卷积神经网络模型和第二卷积神经网络模型中网络结构的全连接层转换为全卷积层。
根据所选出的至少一个选中区域,进行检测框消除和聚合,以得到人脸检测结果之前,还包括:采用所述第二卷积神经网络模型,对各选中区域分别进行边界框回归处理。
优选的,根据所选出的至少一个选中区域,进行检测框消除和聚合,以得到人脸检测结果,包括:对所述选中区域进行置信度排序,获得置信度最高的检测框;以所述置信度最高的检测框为中心,将周围大于第一重叠程度的检测框进行消除;以所述置信度最高的检测框为中心,将周围大于第二重叠程度的检测框聚合为一个人脸检测框,并将最高置信度作为该聚合结果的置信度,以得到所述人脸检测结果。
优选的,所述方法还包括训练卷积神经网络的图像分类任务的步骤,其中所述卷积神经网络包括所述第一卷积神经网络和/或所述第二卷积神经网络:选用包含人脸标注的人脸数据集作为训练样本,对所述训练样本中的训练图像进行剪裁;根据剪裁得到的图像与真实人脸标注的重叠程度,选取正样本和负样本;通过所述卷积层对所述正样本和负样本图像进行过滤处理,获得所述训练图像的特征图,并通过所述池化层对经过所述卷积层过滤处理的图像进行池化,降低所述卷积层输出的特征向量;将所述特征图全连接成一个向量,通过激活函数将所述向量的特征映射出来,获得图像分类结果,所述图像分类结果包括人脸图像类别和非人脸图像类别;将所述图像分类结果通过图像分类任务的损失函数进行迭代。
优选的,所述方法还包括训练第二卷积神经网络的边界框回归任务的步骤:通过将剪裁得到的所述正样本的坐标与真实标注的坐标进行比较,获得训练边界框回归任务的正样本输出标签;将所述正样本输出标签和预先设定的负样本输出标签,通过边界框回归任务损失函数和分类任务损失函数的加权运算进行迭代。
本发明还提供了一种人脸检测装置,包括:
预分类模块,用于采用预先训练的第一卷积神经网络模型对待测图像进行分类处理,确定所述待测图像中各输入区域的第一人脸置信度,根据所述第一人脸置信度从所述输入区域中筛选出至少一个候选区域,所述第一卷积神经网络包括m层卷积层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京眼神科技有限公司,未经北京眼神科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610848895.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理
- 下一篇:避免辨识结果混淆的影像辨识方法