[发明专利]一种基于神经网络和积分图像的人脸定位方法有效
申请号: | 201711494694.9 | 申请日: | 2017-12-31 |
公开(公告)号: | CN107944437B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 容李庆;袁亚荣;罗杰;林锴;汤俊杰;陈纯敏 | 申请(专利权)人: | 广州二元科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州凯东知识产权代理有限公司 44259 | 代理人: | 姚迎新 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于神经网络和积分图像的人脸定位方法,包括以下步骤:1.训练神经网络模型;2.使用训练好的模型对数字图像进行人脸/非人脸的分类以及人脸区域的坐标定位。本发明利用单个简单的神经网络和积分图像以及数字图像处理的技术实现了对数字图像中的人脸进行分类和定位。具有简单快速的特点,具有更好的鲁棒性,对训练样本的数量要求更小,使得训练工作成本更低,整体的实施成本也大大的降低,且对于多状态的人脸分类更具有优势。 | ||
搜索关键词: | 一种 基于 神经网络 积分 图像 定位 方法 | ||
【主权项】:
1.一种基于神经网络和积分图像的人脸定位方法,其特征在于包括以下步骤:1.训练神经网络模型;2.使用训练好的模型对数字图像进行人脸/非人脸的分类以及人脸区域的坐标定位,步骤如下:1)定义最小能定位的人脸尺寸,即最小人脸,根据最小人脸以及图像金字塔的缩放比例为基础对原图像进行缩放,形成图像金字塔;2)定义滑窗的尺寸大小和步长,使用滑窗对图像金字塔中的所有图像进行扫描,将扫描到的矩阵输入至神经网络中,得到分类的预测值;3)对步骤2)中获得的预测值根据人脸置信度阈值进行筛选,选取满足预测值大于阈值的预测框,并根据图像金字塔的缩放比例还原成为原图中的框的尺寸;4)构建一张和原图一致大小的积分图像,具体做法是构建一个尺寸和原图一样的单通道图像矩阵,其中像素值全部为0.0;5)遍历得到的所有符合要求的预测框,预测框中包含该矩阵框在原图中的两个坐标点和预测的值,根据框的坐标信息将积分图像中相应的矩形框中的坐标点的像素值加上该框的预测值,其中每一点的像素值可以用下面的公式表示:
其中R为预测框,m是预测框的总数量,Ri.x1,Ri.x2分别为预测框的左上角和右下角的横轴坐标,Ri.y1,Ri.y2分别为预测框的左上角和右下角的纵轴坐标,p为预测值;6)经过步骤5)之后得到的积分图像实际上为神经网络对原图进行人脸区域预测的概率分布图,定义该图像为积分图;7)通过积分图像,找出包含人脸区域最佳的坐标位置,设定一个最小的通过阈值,从积分图中筛选出所有像素值大于该阈值的坐标组成一个包围框,组成待确定的包围框的组合,每个包围框的分值为当前包围框的值的和,公式如下:
8)使用更改后的非极大值抑制算法选取分值最大的一个包围框;9)根据步骤6)中的积分图特征,越接近人脸的区域得到的分值将会越高,选取一个阈值,寻求大于这个阈值的在步骤8)中的最优包围框中的连续像素包围框;10)获取步骤9)后的人脸框位置的坐标信息,即为定位人脸框的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州二元科技有限公司,未经广州二元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711494694.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种有轨电车行驶辅助系统
- 下一篇:一种文档图像校正方法及移动终端
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序