[发明专利]基于相似度传递的图聚类方法在审

专利信息
申请号: 201811468939.5 申请日: 2018-12-04
公开(公告)号: CN109766910A 公开(公告)日: 2019-05-17
发明(设计)人: 李学龙;陈穆林;王琦 申请(专利权)人: 西北工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西北工业大学专利中心 61204 代理人: 刘新琼
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于相似度传递的图聚类方法。该算法通过在邻近数据点间进行相似度传递,挖掘流形结构,学习出能够反映数据点间拓扑关系的最优图,并通过拉普拉斯秩约束,使所学最优图中具有清晰的类别结构(每个连通分量对应一个类别),避免后处理操作,提高聚类准确率。
搜索关键词: 相似度 聚类 数据点 传递 后处理 类别结构 拓扑关系 秩约束 准确率 流形 算法 连通 邻近 挖掘 清晰 学习
【主权项】:
1.一种基于相似度传递的图聚类方法,其特征在于步骤如下:步骤1:构建一个维度为n的方阵W作为初始化相似图:(1a)假设数据集中包含n个数据点,其中每个数据点都是d维的列向量,第j个数据点由符号xj表示;定义数据点xi和xj的距离为:式中eij为数据点xi和xj的距离,||·||2为向量二范数;(1b)对于数据xi,将其与其他所有点的距离从小到大重新排序,使ei1≤ei2≤…≤ein;(1c)将数据点xi和xj的初始相似度定义为式中ei6为数据点xi与其距离最近的第6个点之间的距离,Wij为xi和xj的相似度;W是由Wij组成的维度为n的方阵,即为构建的初始相似图;步骤2:设计并优化目标函数,得到最优图:(2a)设计目标函数如下:式中方阵S是需要学习的最优图,维度为n,其中Sij为数据点xi和xj更新后的相似度;β是权重参数,I是维度为n的单位矩阵,c是已知的类别数目;rank(·)代表矩阵的秩,方阵LS是S的拉普拉斯矩阵;秩约束rank(LS)=n‑c等同于限制Tr(FTLSF)为0,其中上标T为矩阵转置符号,矩阵F为如下优化问题的最优解:式中Tr(·)为方阵的迹,代表F是维度为n行c列的矩阵;将目标函数(3)转化为如下公式:式中λ是可调节的参数,公式(5)即为最终的目标函数;(2b)初始化变量:在第一次迭代中,将S初始化为W;同时,将参数β固定为1,并将参数λ初始化为1;(2c)固定S优化F:去掉F的无关项,目标函数(5)变为公式(4),F的最优解即为由LS的c个最小特征值对应的特征向量所构成的矩阵;(2d)固定F优化S:根据谱聚类理论,式(5)的第三项Tr(FTLSF)等于其中列向量fi和fj分别为矩阵F的第i行和第j行的转置;因此,公式(5)可以转化为进一步地,记S和I的第i行的转置分别为列向量si和Ii,并定义n维列向量mi使其第j个元素为则公式(6)可以对S的每一行分别求解,以第i行为例:式中符号1代表元素全部为1的n维列向量,LW为方阵W的拉普拉斯矩阵;公式(7)中的si可由增广拉格朗日方法进行快速求解,即得到方阵S中第i行的所有元素;通过对S的所有行求解,可得到更新后的最优图S;对参数λ进行调节,以保证Tr(FTLSF)接近于0;(2e)重复步骤(2c)和(2d)直至公式(5)的目标函数值达到收敛,即得到所求最优图S;步骤3:若两个数据点在最优图S中属于同一连通分量,则两者属于同一类别;否则,两者属于不同类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811468939.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top