[发明专利]一种人脸检测的方法和装置有效
申请号: | 201611185435.3 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106599860B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46 |
代理公司: | 11138 北京三高永信知识产权代理有限责任公司 | 代理人: | 林锦澜<国际申请>=<国际公布>=<进入 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 | ||
本公开提供了一种人脸检测的方法和装置,属于图像处理领域。所述方法包括:对待识别的目标图像进行第一预设次数的卷积处理和第二预设次数的池化处理,得到中间图像;将所述中间图像分割为等大小的预设数目个图像块;在每个图像块中,基于至少一个预设尺寸的候选框,进行区域图像特征提取,得到每个图像块的至少一个区域图像特征信息,其中,每个预设尺寸的候选框的高度大于或等于宽度;根据所述每个图像块的至少一个区域图像特征信息,确定所述目标图像中包含的人脸区域。采用本公开,可以提高人脸检测的处理速度。
技术领域
本公开是关于图像处理领域,尤其是关于一种人脸检测的方法和装置。
背景技术
人脸检测技术是指根据人脸的特征信息,对图像中的人脸进行定位的技术。一般人脸检测技术使用的算法模型是Faster-RCNN(Faster Region-based ConvolutionalNeural Network,快速区域深度卷积网络),具体处理是:
将待识别图像输入到Faster-RCNN中,经过卷积处理和池化处理之后得到像素点数目为N*N的中间图像,然后将中间图像分割为等大小的预设数目个图像块。对于每个图像块,按照高宽比例为1:2、1:1和2:1和面积为1282、2562和5122的9种候选框在图像块中进行区域图像特征提取,得到每个图像块中包含的区域图像特征信息,然后对获取到的区域图像特征信息进行全连接处理,确定出待识别图像包含的人脸区域。
这样,在进行区域图像特征信息提取时,候选框的数目比较多,提取到的区域图像特征信息也比较多,对于每个区域图像特征信息都需进行全连接处理,计算量比较大,从而人脸检测的处理速度比较慢。
发明内容
为了克服相关技术中存在的问题,本公开提供了一种人脸检测的方法和装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种人脸检测的方法,所述方法包括:
对待识别的目标图像进行第一预设次数的卷积处理和第二预设次数的池化处理,得到中间图像;
将所述中间图像分割为等大小的预设数目个图像块;
在每个图像块中,基于至少一个预设尺寸的候选框,进行区域图像特征提取,得到每个图像块的至少一个区域图像特征信息,其中,每个预设尺寸的候选框的高度大于或等于宽度;
根据所述每个图像块的至少一个区域图像特征信息,确定所述目标图像中包含的人脸区域。
可选的,所述预设尺寸的候选框的高度与宽度的比例为1:1和2:1。
可选的,所述根据所述每个图像块的至少一个区域图像特征信息,确定所述目标图像中包含的人脸区域,包括:
基于全连接参数W1=U1∑m1VT1、全连接参数W2=U2∑m2VT2,对所述每个图像块的至少一个区域图像特征信息进行全连接处理,确定所述目标图像中包含的人脸区域。
这样,可以使人脸检测的处理速度提高的更多。
可选的,U1和∑m1VT1是对全连接参数W1'进行奇异值SVD分解得到;
U2和∑m2VT2是对全连接参数W2'进行SVD分解得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611185435.3/2.html,转载请声明来源钻瓜专利网。