[发明专利]人脸图像聚类方法、装置、设备及计算机可读存储介质有效
申请号: | 202110793800.3 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113642607B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 陈文胜;占子豪 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V40/16;G06N3/084 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 关向兰 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种人脸图像聚类方法、装置、设备及计算机可读存储介质,该方法包括:从人脸数据库中获取人脸训练图像,并基于人脸训练图像轮番依次对全连接神经网络的各层基矩阵、深层系数矩阵和激活函数参数进行更新;在更新完成基矩阵、深层系数矩阵和激活函数参数后,得到BP‑DGNMF模型;获取待聚类人脸图像,并将待聚类人脸图像输入至BP‑DGNMF模型,以确定待聚类人脸图像对应的深层特征集合;基于深层特征集合,对待聚类人脸图像执行聚类操作,得到待聚类人脸图像对应的聚类结果。本发明通过轮番依次对全连接神经网络的基矩阵、深层系数矩阵和激活函数参数进行更新,构建了一个具有较高的聚类性能与较低的计算复杂度的BP‑DGNMF模型。
技术领域
本发明涉及人脸图像聚类技术领域,尤其涉及一种人脸图像聚类方法、装置、设备及计算机可读存储介质。
背景技术
随着信息化时代的到来,利用人体固有的生理特征和行为特征进行个人身份的识别和验证变得越来越普及化。随着人脸识别和检索系统应用的推广,系统中人脸图像数据急剧地增长,人脸聚类技术已经成为提高系统检索效率的重要基础。人脸聚类通常是将数据库中的人脸图像信息聚成一些不同的子类,使得子类之间的相似性尽量小,子类内的相似性尽量大,这样在检索时,只需在与被检索目标相似度较高的子类内逐个识别,检索出与之相似性最大的若干记录。
特征提取这一步骤无论在人脸识别还是人脸聚类技术上都占有重要地位。主成分分析(PCA)与奇异值分解(SVD)都是较为经典的特征提取方法,但是这两种方法提出的特征向量通常含有负元素,因此在原始样本为非负的数据下,这些方法不具有很好的解释性。非负矩阵分解(NMF)是一种处理非负数据的特征提取方法,它的应用非常广泛,比如高光谱数据处理、人脸图像识别等。NMF算法在原始样本非负数据矩阵分解过程中,对提取的特征具有非负性限制,即分解后的所有分量都是非负的,因而可以提取非负的稀疏特征。NMF算法的实质是将非负矩阵X近似分解为基图像矩阵W和系数矩阵H的乘积,即X≈WH,且W和H都是非负矩阵。这样矩阵X的每一列就可以表示为矩阵W列向量的非负线性组合。这也表明非负矩阵算法具有强大的可解释性,即对整体的感知是由对组成整体的部分的感知构成的(只有加法没有减法)。近年来,学者们提出了许多对NMF变形的算法,例如,加强局部限制的局部NMF算法(LNMF)、整合判别信息的判别NMF算法(DNMF)、针对对称矩阵提出的对称NMF算法(SNMF)。尽管NMF算法及其变体取得了一定的成效,但该方法只考虑了数据浅层信息,对于含有丰富特征的数据,一次分解而成的单层结构却无法从多角度学习特征的表示。
目前,深度学习(Deep Learning,DL)已成为当前的研究热潮,DL通过建立了具有阶层结构的深度神经网络,为解决深层结构相关的优化难题带来希望。受DL技术成功的启发,一些研究者在单层NMF算法的基础上提出了深度非负矩阵分解(Deep NMF)模型。DeepNMF可以看作是通过将一个复杂的任务分解成几个简单的任务,然后在多层结构中一个接一个地处理它们。与此同时,这种深度分解方法可以探索复杂数据中的底层特征表示,从而提取到比单层学习更完整、更有辨别力的特征。
目前已有的Deep NMF模型虽然具有深度分层结构,但这种结构一般是简单重复使用单层NMF算法来构建的,其性能达不到理想的要求,而且这些方法的计算效率不高。特别地,这些方法均不是利用深度神经网络来产生的,因而不能利用深度神经网络强大的特征表达能力和聚类能力。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种人脸图像聚类方法、装置、设备及计算机可读存储介质,旨在解决人脸图像聚类技术的聚类能力差的技术问题。
为实现上述目的,本发明提供一种人脸图像聚类方法,所述人脸图像聚类方法包括以下步骤:
从人脸数据库中获取人脸训练图像,并基于所述人脸训练图像轮番依次对全连接神经网络的基矩阵、深层系数矩阵和激活函数参数进行更新,其中,所述深层系数矩阵为所述全连接神经网络输入层的输入量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110793800.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像配准方法、电子设备及可读存储介质
- 下一篇:一种水轮机旁通式过鱼装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序