[发明专利]人头区域识别方法、装置及设备有效
申请号: | 201711295898.X | 申请日: | 2017-12-08 |
公开(公告)号: | CN108073898B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 王吉;陈志博;许昀璐;严冰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/52;G06V10/82;G06V10/80;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人头 区域 识别 方法 装置 设备 | ||
1.一种人头区域识别方法,其特征在于,所述方法包括:
获取输入图像;
将所述输入图像输入级联的n个神经网络层中,所述n个神经网络层中的每个神经网络层输出一组候选识别结果,得到人头区域的n组候选识别结果,n≥2;所述神经网络层用于根据预设的提取框对人头区域进行识别,存在至少两个所述神经网络层所采用的所述提取框的尺寸是不同的;
对所述n组候选识别结果进行聚合,得到所述输入图像中人头区域的最终识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述输入图像输入级联的n个神经网络层中,得到人头区域的n组候选识别结果,包括:
将所述输入图像输入所述n个神经网络层中的第一层神经网络层,得到第一层特征图和第一组候选识别结果;
将第i层特征图输入所述n个神经网络层中的第i+1层神经网络层,得到第i+1层特征图和第i+1层候选识别结果,1≤i≤n-1;
其中,所述n个神经网络层中的第i个神经网络层采用的第i提取框的尺寸大于第i+1个神经网络层采用的第i+1提取框的尺寸。
3.根据权利要求1所述的方法,其特征在于,每组所述候选识别结果具有零至多个识别框,所述识别框具有对应的位置;
所述对所述n组候选识别结果进行聚合,得到所述输入图像中人头区域的最终识别结果,包括:
将所述n组候选识别结果中,将所述位置的相似程度大于预设阈值的识别框合并为同一个合并后的识别框,将所述合并后的识别框作为所述输入图像中人头区域的最终识别结果。
4.根据权利要求3所述的方法,其特征在于,每组所述识别框具有对应的相似度值,所述将所述n组候选识别结果中,将所述位置的相似程度大于预设阈值的识别结果合并为同一个识别结果,得到所述输入图像中人头区域的最终识别结果,包括:
获取所述位置的相似程度大于所述预设阈值的识别框对应的相似度值;
在所述位置的相似程度大于所述预设阈值的识别框中,保留相似度值最大的识别框,删除其他的识别框;
将所述保留的识别框作为所述输入图像中人头区域的最终识别结果。
5.根据权利要求4所述的方法,其特征在于,所述在所述位置的相似程度大于所述预设阈值的识别框中,保留相似度值最大的识别框,删除其他的识别框,包括:
获取所述识别框中相似度值最高的作为第一识别框;
将与所述第一识别框重叠面积大于所述预设阈值的识别框删除;
在第一剩余识别框中获取相似度值最高的作为第二识别框;所述第一剩余识别框是所述n组候选识别结果对应的识别框除去所述第一识别框和删除的识别框后剩余的识别框;
将与所述第二识别框重叠面积大于所述预设阈值的识别框删除;
在第j-1剩余识别框中获取相似度值最高的作为第j识别框;所述第j-1剩余识别框是所述n组候选识别结果对应的识别框除去第一识别框至第j-1识别框以及删除的识别框后剩余的识别框,2≤j≤n;
将与所述第j识别框重叠面积大于所述预设阈值的识别框删除;
重复上述步骤,从所述n组候选识别结果对应的识别框中获取k个识别框,2≤k≤n;
所述将所述保留的识别框作为所述输入图像中人头区域的最终识别结果,包括:
将所述k个识别框作为所述输入图像中人头区域的最终识别结果。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述将所述输入图像输入级联的n个神经网络层中包括:
对所述输入图像进行局部提亮和/或降低分辨率处理;
将局部提亮和/或降低分辨率处理后的所述输入图像输入级联的n个神经网络层中。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
获取样本图像,所述样本图像中标定有人头区域,所述人头区域包括:侧视人头区域、俯视人头区域、后视人头区域和遮挡人头区域中的至少一种;
根据所述样本图像对所述级联的n个神经网络层进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司,未经腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711295898.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视线的活体认证方法
- 下一篇:基于骨骼信息的绊线检测的方法及装置