[发明专利]一种联合深度神经网络和成对约束的聚类方法在审
申请号: | 201811442502.4 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109635946A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 李卓聪;王家兵 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 成对约束 编码器 聚类 聚类算法 网络 自编码 神经网络学习 降维操作 损失函数 网络模型 差向量 数据集 联合 构建 重构 样本 输出 | ||
1.一种联合深度神经网络和成对约束的聚类方法,其特征在于,包括以下步骤:
给定包括成对约束的数据集;
构建两个相同结构的自编码器网络和一个深度神经网络;其中两个自编码器网络分别输入所述数据集中的每一个约束对的两个样本;所述两个自编码器网络的中间输出的差向量,作为深度神经网络的输入;
训练所述自编码器网络和深度神经网络;
将训练好的自编码器网络的中间输出作为样本的特征,利用聚类算法进行聚类任务。
2.根据权利要求1所述的联合深度神经网络和成对约束的聚类方法,其特征在于,使用数据集的每一约束对的两个样本分别作为两个自编码器网络的输入,将两个自编码器网路的中间输出相减,得到的差向量作为深度神经网络的输入,两个样本的成对约束标签作为深度神经网络输出的正确标记。
3.根据权利要求2所述的联合深度神经网络和成对约束的聚类方法,其特征在于,使用数据集的每一约束对的两个样本分别作为两个自编码器网络的输入,将两个自编码器网路的中间输出相减,得到的差向量作为深度神经网络的输入,两个样本的成对约束标签作为深度神经网络输出的正确标记,具体方法如下:
构建两个结构相同的自编码器网络,该网络的输入分别为每一个约束对的两个样本,输出分别为重构后的输入样本;将两个自编码器的中间输出相减,得到两个样本的中间输出的差向量,将差向量作为深度神经网络的输入;在深度神经网络的最后一层加上softmax层,从而得到成对约束的预测结果;其中所述softmax层是为了将深度神经网络的输入转变为一个成对约束标签预测的概率分布,选取最大概率的输出作为标签的预测结果;而所述标签的预测结果则是判别两个样本在同一类的概率和不在同一类的概率。
4.根据权利要求3所述的联合深度神经网络和成对约束的聚类方法,其特征在于,构建的网络结构中含有自编码器网络AE和深度神经网络DNN,因此训练网络时使用的损失函数公式如下:
L(AE,PC,CLU)=L(AE)+L(PC)+L(CLU)
其中L(AE)为自编码器损失,L(PC)为深度神经网络的成对约束预测损失,L(CLU)为聚类损失;
所述自编码器损失的计算公式如下:
L(AE)=L(X,X′)=||X-X′||2=||X-WH||2
深度神经网络的成对约束损失的计算公式如下:
聚类损失的计算公式如下:
对于自编码损失,采用输入自身和经过网络重构得出的结果做最小二乘运算;其中WH代表X通过自编码网络重构出的结果,W是自编码网络中解码网络的权值矩阵,H是自编码网络的解码网络的输入;对于深度神经网络的成对约束损失,采用了交叉熵的计算方法,其中yi代表预测的成对约束标签,代表真实的成对约束标签;对于聚类损失,采用了k-means聚类方法的损失函数,hi表示深度神经网络的第i个输入,M代表聚类中心,Sj是一个向量,该向量只有一个值为1,表示该输入属于该聚类;其余为0,表示该输入不属于该聚类。
5.根据权利要求4所述的联合深度神经网络和成对约束的聚类方法,其特征在于,在网络训练阶段,则联合自编码器网络和深度神经网络交替进行;在正向传播过程中,两个自编码器网络中通过正向传播,分别得到重构后样本A的向量X′A和样本B的向量X′B;将两个自编码器网络的中间输出相减,得到的差向量作为深度神经网络的输入,通过正向传播,获得成对约束标签;最后将两个自编码网络的中间输出用于聚类;在反向传播过程中,通过计算自编码损失,成对约束损失和聚类损失,更新两个自编码器网络和深度神经网络,更新直到整体损失收敛后停止;在每轮的训练过程中,采用随机梯度下降算法,更新两个自编码器网络和深度神经网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811442502.4/1.html,转载请声明来源钻瓜专利网。