[发明专利]一种基于深度学习的实时人脸检测方法及系统在审
申请号: | 201710106887.6 | 申请日: | 2017-02-27 |
公开(公告)号: | CN106874883A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 张卫山;孙浩云;宫文娟;卢清华;李忠伟 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F9/50 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 黄海丽 |
地址: | 266580 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 实时 检测 方法 系统 | ||
技术领域
本发明涉及一种基于深度学习的实时人脸检测方法及系统。
背景技术
深度学习是目前机器学习发展的最高度,卷积神经网络作为深度学习中的一种方法,在物体识别、图像处理等领域有着较高的效果。对于人脸特征提取,卷积神经网络有着可以自动学习图像特征的优势,减少人工干预,提取出高质量的特征,从而为提高人脸检测的准确率打下了坚实的基础。
由于深度学习的方法可能消耗大量的GPU资源,计算量过大可能达不到实际应用场景中实时的效果,为了解决大数据实时处理问题,分布式实时处理框架Storm应运而生,Storm有许多应用领域,包括实时分析、在线机器学习、信息流处理、连续性的计算、分布式RPC和ETL等。
随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性、安全性和实用性提出了更高的要求,人脸检测是人脸识别和重构问题中最基本的任务,同样也是人脸识别问题中的一个关键环节,其结果直接关乎到人脸识别最终的效果。若能对其进行精准的检测定位,不仅能提高视频监控工作人员的工作效率,对视频的检索、维护公共安全秩序具有重要意义。
有鉴于此,急需解决视频监中人脸检测准确率较低和速率较低的问题。
发明内容
本发明所要解决的技术问题是如何将卷积神经网络应用于人脸检测技术中,并达到实时人脸检测的效果的问题,本发明提供了一种基于深度学习的实时人脸检测方法及系统。
为了解决上述技术问题,本发明所采用的技术方案是:
一种基于深度学习的实时人脸检测方法,包括以下步骤:
步骤S10:构建人脸数据库,并设计用于人脸检测的卷积神经网络;
步骤S20:利用人脸数据库对卷积神经网络进行训练,得到最优卷积神经网络,利用最优的卷积神经对人脸数据库的人脸数据进行特征提取,取得人脸特征;
步骤S30:构建Storm的拓扑结构,所述Storm的拓扑结构包括若干个数据源输入组件spout;每个数据源输入组件spout分别与若干个数据处理组件bolt连接;
在以数据源输入组件spout为父节点的数据处理组件bolt上分别布置训练好的最优卷积神经网络,且所有数据处理组件bolt具有相同的子节点;所述相同的字节点用于将检测到的人脸区域坐标在检测图像上进行标注和返回检测结果;
步骤S40:数据源输入组件spout将采集的待检测的人脸图像实时视频流分发给各个数据处理组件bolt,每个数据处理组件bolt通过预先布置的最优卷积神经网络进行人脸部位识别、通过分类器对识别的结果进行人脸/非人脸分类、将人脸部位通过最优卷积神经网络进行边界框回归并得出人脸部位在原图中的坐标,返回人脸坐标结果。
所述步骤S40:采用一种基于GPU的资源调度算法:在Storm集群上,通过检测集群中GPU的资源使用情况实时调度任务资源。用基于GPU的资源调度算法实时监控各个数据处理组件bolt的GPU使用状况,将GPU消耗大的进程分配到有强GPU的数据处理组件bolt上。
所述人脸数据库包括多种角度的人脸信息,每种角度的人脸信息包括多张图片。
所述步骤S20包括以下步骤:
将人脸数据库中的信息作为卷积神经网络的输入数据源,使用设定的卷积神经网络默认参数进行卷积神经网络训练;所述默认参数包括初始权值、训练速率和迭代次数;
根据训练中间结果,对默认参数进行不断调整,直到得到最优卷积神经网络网络参数,进而得到最优卷积神经网络;
所述步骤S10中,用于人脸检测的卷积神经网络自上而下包括三个网络结构:
第一个网络结构,包括三层卷积层:
第一卷积层:Input Size 12×12×3,卷积核:3×3、
第二卷积层:Input Size 5×5×10,卷积核:3×3和
第三卷积层:Input Size 3×3×16,卷积核:3×3,
第一个网络结构用于人脸/非人脸区域判断并获得人脸区域的候选窗口、对人脸区域进行边界框回归并得到回归向量;
第二个网络结构,包括三个卷积层和第一全连接层,自上而下依次是:
第四卷积层:Input Size 24×24×3,卷积核:3×3、
第五卷积层:Input Size 11×11×28,卷积核:3×3、
第六卷积层:Input Size 4×4×48,卷积核:2×2、
第一全连接层:Out Size 128,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710106887.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:路面病害边缘检测方法和装置
- 下一篇:基于部位分割的人体再识别方法