[发明专利]一种基于标签自适应策略的深度半监督图像聚类方法有效

申请号：	202010084739.0	申请日：	2020-02-10
公开（公告）号：	CN111259979B	公开（公告）日：	2022-11-18
发明（设计）人：	陈志奎;李超杰;高静;李朋	申请（专利权）人：	大连理工大学
主分类号：	G06V10/762	分类号：	G06V10/762;G06F16/55
代理公司：	大连理工大学专利中心 21200	代理人：	李晓亮;潘迅
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于标签自适应策略深度监督图像方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于标签自适应策略的深度半监督图像聚类方法，其特征在于，所述的深度半监督图像聚类方法包括以下步骤：

步骤1、学习潜在特征空间；

采用堆叠自编码器网络构建高维数据的低维特征空间，学习原始图像数据的低维语义表示；利用降噪自编码机逐层初始化堆叠自编码器网络，设定x表示降噪自编码机的输入，t表示降噪自编码机的输出，具体的计算过程如下：

其中，Dropout(·)是一个随机映射，随机地将输入层的一部分随机设置为0，是对输入x进行随机映射后的结果，h是降噪自编码机的中间输出结果，是对h进行随机映射后的结果，g₁和g₂分别代表编码器和解码器的激活函数，θ＝{W₁,b₁,W₂,b₂}是网络的参数；降噪自编码机通过最小化平方损失来完成训练；在训练完第一层之后，第一层的输出h作为下一层的输入，依据公式(1)、(2)、(3)、(4)训练网络第二层，以此类推，逐层初始化堆叠自编码器网络；为保证重构初始输入和最终的潜在空间能包含全部的信息，将第一组自编码器的g₂和最后一组自编码器的g₁设置为常数1，除此之外，所有自编码器的g₁和g₂都设置为ReLU激活函数；逐层训练后，将所有的编码器层和解码器层连接起来，使用随机梯度下降算法微调整个网络，最小化重构损失，最终得到一个多层的已初始化的深度自编码器网络；然后，使用编码器层作为初始数据空间和潜在特征空间之间的初始映射f_θ:X→Z，其中θ是学习到的参数，X是图像的初始数据空间，Z是潜在特征空间；

步骤2、初始化聚类簇心；

给定n个图像样本的集合使用已初始化的深度自编码器网络，生成数据点x_i在潜在特征空间Z中的对应点z_i＝f_θ(x_i)∈Z，利用K-means聚类方法在潜在特征空间中得到k个初始化的聚类簇心采用欧氏距离平方度量样本之间的相似度，将样本与其所属类的簇心之间的距离总和作为损失函数，K-means的过程即最小化损失函数(5)：

其中，j＝C(i)表示划分，其中i∈{1,2,...,n}，j∈{1,2,...,k}；由于上式的直接求解是NP难的问题，因此只能采用启发式的迭代方法进行求解；首先随机选择k个类的簇心，将样本逐个指派到与其最近的簇心的类中，得到中间聚类结果；然后更新每个类的簇心的均值，作为类的新的簇心；重复以上步骤，直到划分不再改变，得到聚类结果，并将最终的聚类结果用作潜在特征空间中的初始聚类簇心；

步骤3、深度嵌入聚类；

给定初始非线性映射f_θ和初始化的聚类簇心交替使用下述两个步骤来改善聚类性能；第一步，计算潜在特征空间中的数据点和聚类簇心之间的软分配；第二步，利用辅助目标分布从当前的高置信分配中学习聚类损失；

1)软分配

使用Student’s-t分布来测量特征点z_i和簇心μ_j之间的相似度，计算公式如下：

其中，z_i＝f_θ(x_i)∈Z表示原始数据x_i∈X在潜在特征空间中的对应点，q_ij为样本i被分配到类别j的概率；

2)KL分布最小化

使用辅助目标分布指导网络学习，从高置信度的分配中学习聚类损失，通过KL散度度量目标分布与网络输出分布间的代价；先将q_i升至二次幂，然后按每个簇的频率进行归一化来计算得到辅助目标分布p_i，计算公式如下所示：

其中，f_j＝∑_iq_ij为类别j的软频率；

让软分配尽可能地匹配目标分布，将聚类损失定义为软分配q_i和辅助目标分布p_i之间的KL散度损失，定义如公式(8)所示；

如此，通过拟合软分配和目标分布，获得具有高置信度的聚类损失L₁，使用聚类损失进一步更新深度映射f_θ和优化聚类簇心

步骤4、标签自适应策略；

首先，构建样本标签列表A记录样本点是否具有真实标签，样本标签列表A中的元素a_i定义如下：