[发明专利]一种无监督的人脸图像二次聚类方法、装置、介质有效
| 申请号: | 202111300505.6 | 申请日: | 2021-11-04 |
| 公开(公告)号: | CN113920353B | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 齐战胜;钟敏;张李钦;王志豪;林淑强;翟永强 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
| 主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V40/16;G06V10/74;G06N3/04;G06N3/08 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郭涵炜 |
| 地址: | 361000 福建省厦门市思明*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 监督 图像 二次 方法 装置 介质 | ||
本发明提出了一种无监督的人脸图像二次聚类方法、装置及存储介质,该方法包括:对获取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果;基于所述聚类结果中的每个簇中的图像数量分为离散簇和聚集簇;在选出每个簇的代表元后,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进行聚集簇之间的合并,得到二次聚类后的人脸图像。本发明创造性地提出了二次聚类的方式,在前后两次聚类中使用不同的相似度阈值,逐步求精;并且在聚类过程,针对聚类样本/聚类簇的特点对相似度计算作精细调整,最终实现高精确率和高归档率的人脸聚类。
技术领域
本发明涉及人工智能技术领域,具体涉及一种无监督的人脸图像二次聚类 方法、装置、介质。
背景技术
人脸聚类是重要的人脸识别下游任务,其基本流程是在获取手工设计或通 过网络embedding得到的高维人脸特征向量的基础上,利用各种聚类方法进行 人脸聚类。目前常见的人脸聚类方法大致分为两种:无监督聚类方法,例如K- Means、Spectral、DBSCAN等方法;有监督聚类方法,例如CDP、GCN等方法。
但是,上述聚类方法应用于真实场景,如安防抓拍场景下的聚类主要存在两 个问题:一是抓拍图质量问题,由于抓拍人脸在角度,光照,姿态等方面的差异 较大,存在较多低质量图像,此时人脸识别系统提取到的人脸特征不够充分,导 致聚类困难;二是抓拍库的数量问题。应用于百万级甚至千万级人口城市的人脸 聚类时,由于相似人脸很多,聚类算法中的相似度阈值选择十分困难,具体来说, 阈值选择过大容易出现聚类遗漏,而阈值选择过小则容易出现聚类错误。因此, 大规模人脸聚类时,聚类方案的选定、聚类阈值的设置以及如何保证低质量图像 相似度计算的可靠性,是工程技术人员面临的技术难题。
发明内容
本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
一种无监督的人脸图像二次聚类方法,该方法包括:
初次聚类步骤,对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张 人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分步骤,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代表元 rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;
二次聚类步骤,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进 行聚集簇之间的合并,得到二次聚类后的人脸图像。
更进一步地,所述对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整的操作为:使用卷积神经网络获取n 张人脸图像的高维人脸归一化特征向量emb,并计算每一人脸图像的表示人脸特 征质量的图像质量分数dp_score;计算n张人脸图像的1:n的余弦相似度并排 序得到前top_k个相似度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸 图像的图像质量分数dp_score调整相似度矩阵D:如果两张人脸图像中任意一 张的质量分dp_score小于第一阈值thres_1,则将它们之间的相似度置为0, 如果否,则判断两张人脸图像的质量分dp_score是否都小于第二阈值thres_2, 如果是,则在thres_1和thres_2之间,根据较低分图片的质量分,线性衰减二 者之间的相似度,处理完毕后得到调整后的相似度矩阵D,其中, thres_1thres_2。
更进一步地,所述基于调整后的相似度矩阵对n张人脸图像进行初次聚类 得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据调整 后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像相似 度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量=2,则认为 该人脸图像为核心点core_samples;根据neighbors和core_samples对所有人 脸图像进行连通计算,得到所述初次聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111300505.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





