[发明专利]基于相似度传递的图聚类方法在审
申请号: | 201811468939.5 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109766910A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 李学龙;陈穆林;王琦 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度 聚类 数据点 传递 后处理 类别结构 拓扑关系 秩约束 准确率 流形 算法 连通 邻近 挖掘 清晰 学习 | ||
1.一种基于相似度传递的图聚类方法,其特征在于步骤如下:
步骤1:构建一个维度为n的方阵W作为初始化相似图:
(1a)假设数据集中包含n个数据点,其中每个数据点都是d维的列向量,第j个数据点由符号xj表示;定义数据点xi和xj的距离为:
式中eij为数据点xi和xj的距离,||·||2为向量二范数;
(1b)对于数据xi,将其与其他所有点的距离从小到大重新排序,使ei1≤ei2≤…≤ein;
(1c)将数据点xi和xj的初始相似度定义为
式中ei6为数据点xi与其距离最近的第6个点之间的距离,Wij为xi和xj的相似度;W是由Wij组成的维度为n的方阵,即为构建的初始相似图;
步骤2:设计并优化目标函数,得到最优图:
(2a)设计目标函数如下:
式中方阵S是需要学习的最优图,维度为n,其中Sij为数据点xi和xj更新后的相似度;β是权重参数,I是维度为n的单位矩阵,c是已知的类别数目;rank(·)代表矩阵的秩,方阵LS是S的拉普拉斯矩阵;
秩约束rank(LS)=n-c等同于限制Tr(FTLSF)为0,其中上标T为矩阵转置符号,矩阵F为如下优化问题的最优解:
式中Tr(·)为方阵的迹,代表F是维度为n行c列的矩阵;将目标函数(3)转化为如下公式:
式中λ是可调节的参数,公式(5)即为最终的目标函数;
(2b)初始化变量:在第一次迭代中,将S初始化为W;同时,将参数β固定为1,并将参数λ初始化为1;
(2c)固定S优化F:去掉F的无关项,目标函数(5)变为公式(4),F的最优解即为由LS的c个最小特征值对应的特征向量所构成的矩阵;
(2d)固定F优化S:根据谱聚类理论,式(5)的第三项Tr(FTLSF)等于其中列向量fi和fj分别为矩阵F的第i行和第j行的转置;因此,公式(5)可以转化为
进一步地,记S和I的第i行的转置分别为列向量si和Ii,并定义n维列向量mi使其第j个元素为则公式(6)可以对S的每一行分别求解,以第i行为例:
式中符号1代表元素全部为1的n维列向量,LW为方阵W的拉普拉斯矩阵;公式(7)中的si可由增广拉格朗日方法进行快速求解,即得到方阵S中第i行的所有元素;通过对S的所有行求解,可得到更新后的最优图S;对参数λ进行调节,以保证Tr(FTLSF)接近于0;
(2e)重复步骤(2c)和(2d)直至公式(5)的目标函数值达到收敛,即得到所求最优图S;
步骤3:若两个数据点在最优图S中属于同一连通分量,则两者属于同一类别;否则,两者属于不同类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811468939.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于谱图融合的海岸环境微塑料老化行为解析方法
- 下一篇:一种行为预测方法