[发明专利]基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备有效
申请号: | 202110217629.1 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112926658B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 郭宇;张亚军;张秋光;孙源;王飞 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/74;G06V10/77 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 房鑫 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 二维 数据 嵌入 邻接 拓扑 图像 方法 设备 | ||
基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备,该图像聚类方法包括同时学习一组图像数据的二维嵌入表示和结构化的相似图,在图像数据的二维嵌入表示上学习带有自适应最优邻域分配的相似图,通过在学习到的图的拉普拉斯矩阵施加秩约束来使得相似图的连通块数量等于期望的聚类个数,从而完成二维图像数据聚类的任务。本发明同时提供了一种实现上述方法的系统、终端及计算机可读存储介质。本发明充分利用了图像像素的空间关系,提升了图像数据的聚类性能,通过挖掘图像的内在关系而构建出高质量的相似拓扑图,避免了单独学习二者可能带来的次优解问题,最终提升了图像聚类性能。
技术领域
本发明属于图像聚类领域,涉及基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备。
背景技术
聚类在机器学习和数据挖掘中起着至关重要的作用,它的目标是将数据点分成若干个不相交的组,相似的数据点被分配到同一个组里。由于聚类的重要作用,许多聚类方法被陆续提出,例如K均值聚类、层次聚类、谱聚类、最大间隔聚类和多视图聚类等等。由于K均值聚类算法具有高效并且简单的特点,因此K均值聚类是使用最广的聚类算法。当前存在的大多数聚类算法只能从低维样本中获得较好的性能,为了解决这个问题。研究者们提出了一种方法,该方法可以从高维数据中学习低维表示,然后利用学习到的低维特征进行聚类。
主要成分分析(PCA)是进行数据降维常用的方法,而经典的K均值聚类能够在低维表示上执行聚类。一些研究者使用线性判别分析(LDA)把原始数据投影到低维空间,由于编码了判别信息,把K均值和LDA整合成为一个框架能够获得更好的性能。近年来,研究者提出了一个同时学习图像的2D嵌入特征以及在嵌入特征使用K均值聚类的框架,该方案虽然高效并能达到不错的效果,但这种方案的初始化仍然存在问题,因为K均值聚类算法如果没有好的初始化很可能得到很差的结果。基于拓扑图的方法是另外一个重要的方向,一些基于数据间关系的图表示已经展示出很好的性能,包括ratio cut、normalize cut和谱聚类。基于图的聚类算法的性能依赖于构建一个高质量的相似图去准确的捕捉数据的内在关系。为了提升聚类结果的性能,基于图的聚类方法常常需要在相似图的基础上进行预处理。研究者们提出通过识别显著特征在相似图中编码局部邻接关系以有效的解决这一问题,为了构建相似图,将数据样本对应于相同子空间的稀疏表示。稀疏子空间聚类由Elhamifar和Vidal提出,探索数据样本在相同子空间的稀疏表示。尽管如此,上述方法不能保证获得理想的聚类结构的图。
尽管上述聚类方法已经获得了很好的性能,它们在直接用于图像聚类时仍然存在着一些不足之处。首先,这些方法的大多数将图像矩阵转换成一个向量,这样处理忽略了像素间的空间关系并且增加了计算量。其次,上述基于图的聚类方法一般会包括两个阶段,数据嵌入和子序列聚类,这样的过程导致了学习图像数据的低维表示是构造结构图的最优方法。
发明内容
本发明的目的在于针对上述现有技术中二维图像数据聚类效率以及质量不高的问题,提供一种基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备,高效、准确的完成图像聚类。
为了实现上述目的,本发明有如下的技术方案:
一种基于二维数据嵌入与邻接拓扑图的图像聚类方法,包括以下步骤:同时学习一组图像数据的二维嵌入表示和结构化的相似图,在图像数据的二维嵌入表示上学习带有自适应最优邻域分配的相似图,通过在学习到的图的拉普拉斯矩阵施加秩约束来使得相似图的连通块数量等于期望的聚类个数,从而完成二维图像数据聚类的任务。
作为本发明基于二维数据嵌入与邻接拓扑图的图像聚类方法的一种优选方案,通过在图像数据集X上对数据进行双边投影变换获得图像数据的二维嵌入表示。
作为本发明基于二维数据嵌入与邻接拓扑图的图像聚类方法的一种优选方案,对数据进行双边投影变换的计算表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217629.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置