[发明专利]一种深度图像聚类方法、系统及存储介质在审
申请号: | 202310621703.5 | 申请日: | 2023-05-30 |
公开(公告)号: | CN116342915A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 张瑞霖;王鸿鹏;郑海阳;谢甜 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/77;G06T7/50 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 朱丽萍 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 图像 方法 系统 存储 介质 | ||
本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种深度图像聚类方法、系统及存储介质。
背景技术
随着信息技术的快速发展,信息产生渠道日益多元化,数据的爆炸式增长为各行业领域高质量发展带来了丰富的数据支撑,如何从繁杂的数据中分析出高价值模式信息是各行业高质量发展的前提。如今,图像数据是各行业产生最多,最常见的一类数据。如何从图像数据中挖掘出有用的模式信息已经变得非常重要。事实上,各行业产生的原始图像数据往往缺少标签信息,此外由于人工标注带来的成本限制和主观操作因素,以无监督为特点的图像聚类成为数据分析的首要选择。作为人工智能,机器学习,数据挖掘,模式识别领域中的关键技术之一,图像聚类旨在将目标图像划分为不同的群组,使同一群组的图像之间具有高度的同质性,而不同群组的图像具有最大的差异性,可快速约减原始数据间的冗余和无用信息,揭示出数据潜在的模式或结构,有助于数据的深度处理和再加工,也是众多以数据为中心的高阶任务处理原始数据的基础方法。由于具有无监督特性,图像聚类被广泛应用于图像检索,图像标注,视觉语义理解中。
面对高维、大规模的图像数据,传统的聚类方法往往产生很低的聚类精度,如基于密度的聚类(DBSCAN),基于划分的聚类(K-means),层次聚类,谱聚类等,这主要因为算法在聚类图像数据时面临着高维数据的维度诅咒、浅层的手工特征、失效的相似性等固有局限。同时传统算法依赖的计算平台是基于CPU,无法高效处理矩阵类型数据如图像。
最近,结合深度学习的聚类范式(称为深度聚类:DC)获得了很多关注,因为它弥补了传统聚类方法和高维数据之间的差距。 从技术上讲,DC方法旨在利用无监督的神经网络来学习原始数据的嵌入表示,以帮助聚类任务,同时反过来使用当前的分配结果来进一步优化数据嵌入。DEC是第一个实现数据表示和聚类联合学习的深度聚类方法。DEC使用自编码器作为网络架构,训练自编码器后,只保留编码器部分用于特征提取,然后将提取的特征作为聚类模块的输入。通过计算特征空间中各点属于当前各聚类中心的概率,将得到的概率分布与目标分布进行对比,计算KL(Kullback-Leibler)散度,对聚类模块进行优化,最终得到聚类结果。DEC作为深度聚类领域中的开创性工作,明确定义了面向聚类的损失用于同时进行特征表示学习和聚类任务。由于过程简单和清晰的数学背景,DEC得到了广泛的研究,包括堆叠复杂的网络模块{IDEC,LGCC,SCDCC,VaDE},增加辅助学习目标{LNSCC, ASPC-DA,DCC},自适应参数确定(DipDECK,DeepDPM,DTC),以及嵌入多种划分操作(ICDM,IDECF,DEMC)。尽管在各种应用中都表现出了良好的性能,但我们观察到现有的方法在对图像数据进行聚类时仍然忽略了一些重要的考虑因素,特别是复杂的图像数据。
1)首先,现有的聚类方法通常缺少在特征学习过程中对图像中局部区域进行信息融合。具体来说,大多数DC方法通常采用Autoencoder(AE)或其高级变体来实现无监督的特征学习,在这种情况下,由于忽略了图像上下文,学习到的特征对图像聚类任务来说是低判别性的。事实上,人类通过融合图像中尽可能多的局部区域特征来感知一个物体,从而理解其整体语义。例如,在猫科动物分类中,来自图像不同区域的信息,如头部、身体、四肢、尾巴和背景,被结合起来进行判断。对此,我们有一个关键的见解,在提取无监督特征之前,在图片的不同区域之间引入具有全局视野的信息融合,有利于特征提取过程中保留更多的聚类有益的整体语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310621703.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种位置可调的凸轮分割器
- 下一篇:一种构件吊装精准定位导向装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序