[发明专利]一种基于深度学习特征的人脸样本清洗方法及系统有效
申请号: | 201611146140.5 | 申请日: | 2016-12-13 |
公开(公告)号: | CN106650804B | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 刘荣杰;牟永强;田第鸿 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 李利 |
地址: | 518000 广东省深圳市龙岗区横岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 特征 样本 清洗 方法 系统 | ||
本发明适用于数据挖掘及样本清洗领域,提供了一种基于深度学习特征的人脸样本清洗方法,所述人脸样本清洗方法包括以下步骤:A、利用深度学习技术对人脸图像特征进行提取;B、根据给定的进程数对需要进行处理的样本进行划分,并分配至每个进程;C、对每个进程中相应的人脸特征进行聚类处理;D、在每个聚类结果中选取图像数量最多的类作为主类;E、将主类特征对应图像拷贝至目标目录并保留原有文件结构。深度学习提取的人脸特征维度低而且具有非常好的鉴别能力,一方面可以提高样本的清洗精度,另一方面也可以节约清洗时间;多进程并行设计,能够充分利用硬件的运算能力,从而提高整个运算的效率,降低耗时。
技术领域
本发明属于数据挖掘及样本清洗领域,所使用的技术基于图像处理和机器学习,尤其涉及一种基于深度学习特征的人脸样本清洗方法及系统。
背景技术
深度学习提取人脸特征: 深度学习是机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。一个观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更加容易地从实例中学习任务(例如,人脸识别或面部表情识别)。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法:是一个比较有代表性的基于密度的非监督式聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
多进程并行运算:当用户敲入命令执行一个程序的时候,对系统而言,它将启动一个进程。但和程序不同的是,在这个进程中,系统可能需要再启动一个或多个进程来完成独立的多个任务。多进程编程的主要内容包括进程控制和进程间通信,利用多进程能够将一个大型的任务拆分成多个小任务交给多个进程同时处理,从而成倍地提高运算速度。
现有技术方案:a). 特征提取:
i. 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征: 是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
ii. Gabor特征提取:Gabor 滤波器定义为:其脉冲响应为一个谐波函数(即下式中的余弦函数)和一个高斯函数的乘积。根据信号与系统理论,时频域的卷积和乘积互为傅里叶变换。Gabor滤波器的傅里叶变换为谐波和高斯函数各自傅里叶变换的卷积。它的小波特性说明了Gabor滤波结果是描述图像局部灰度分布的有力工具, 因此, 可以使用Gabor滤波来抽取图像的纹理信息。
b). 人脸分类方法:
i. 支持向量机SVM (Support Vector Machine): 是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。SVM的主要思想可以概括为两点:⑴它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;⑵它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。
ii. KNNK最邻近结点算法(k-Nearest Neighbor algorithm):该算法的基本思路是:在给定新图像后,考虑在训练图像集中与该新图像距离最近(最相似)的 K 个图像,根据这 K 个图像所属的类别判定新图像所属的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611146140.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算字符串间相似度的方法及装置
- 下一篇:羽绒被