[发明专利]一种深度图像聚类方法、系统及存储介质在审
申请号: | 202310621703.5 | 申请日: | 2023-05-30 |
公开(公告)号: | CN116342915A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 张瑞霖;王鸿鹏;郑海阳;谢甜 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/77;G06T7/50 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 朱丽萍 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 图像 方法 系统 存储 介质 | ||
1.一种深度图像聚类方法,其特征在于,包括以下步骤:
步骤一,将含有n个样本的图像数据集输入编码器;
步骤二,编码器将步骤一输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;
步骤三,聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果;
步骤四,网络开始优化,并不断更新网络,直到满足迭代停止条件,否则返回步骤一。
2.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述编码器运行如下步骤:
步骤1,由Patch-Embedding层将输入的原始图像分割为多个补丁块,并利用卷积运算将每个补丁块转换为一维向量;
步骤2,将步骤1转换的一维向量顺序送入线性组合、Encoding-layer层,得到原始图像的低维嵌入特征;
步骤3,将步骤2获得的低维嵌入特征分别输出给解码器和维度约减模块。
3.根据权利要求2所述的深度图像聚类方法,其特征在于,所述编码器由一个Patch-Embedding层、5个Transformer构成的线性组合,一个Encoding-layer层组成。
4.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述解码器将得到的重构损失用于训练网络,重构损失定义如下:
(1)
其中,表示图像i ,
5.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述维度约减模块中的维度约减损失定义如下:
(2)
和分别代表输入的嵌入特征和输出的聚类特征的整体分布,通过最小化两个分布的KL散度得到友好的二维特征;其中表示嵌入特征
6.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤三还包括:
步骤S1,依据网络产生的图像数据集X的二维特征,聚类划分模块计算每个图像样本的密度,然后选取K个簇中心;
步骤S2,度量每个图像样本到每个簇的概率,最终得到聚类结果。
7.根据权利要求6所述的深度图像聚类方法,其特征在于,所述步骤S1中,密度定义如下:
(5)
其中,
距高密度样本的最小距离计算如下:
(6)
其中,表示图像
簇中心的决策值定义如下:
(7)
图像数据集X中具有K个最大决策值的图像即为簇中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310621703.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种位置可调的凸轮分割器
- 下一篇:一种构件吊装精准定位导向装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序