[发明专利]一种基于拉普拉斯中心性的峰值聚类方法在审
申请号: | 201710292849.4 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107194415A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 杨旭华;陈果;朱钦鹏 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于拉普拉斯中心性的峰值聚类方法,首先把待分类的数据集转换成一个加权的完全图,每个数据点为一个节点,两个数据点之间的距离作为相应两个节点之间边的权值;用拉普拉斯中心性去计算和评价该网络每个节点的局部重要性;聚类中心为局部的密度中心,比周围的邻居节点具有更高的拉普拉斯中心性并且和具有更高拉普拉斯中心性的节点具有较大的距离的节点;对所有的类簇中心贴上类簇标签,对没有类簇标签的节点,归属到距离最近的有类簇标签的节点所属的类簇中,并获得该类簇的标签。本发明将评价网络节点重要性的算法引入到评价待分类数据点的重要性方面,算法精确度高、可以实现无参数的快速聚类。 | ||
搜索关键词: | 一种 基于 拉普拉斯 心性 峰值 方法 | ||
【主权项】:
一种基于拉普拉斯中心性的峰值聚类方法,其特征在于:包括以下步骤:步骤一:建立数据集模型D={vi},i=1…n,其中vi为数据集D中的任意数据点,数据点vi和vj之间的距离值为dij;步骤二:将待分类数据集D转化成为一个加权完全图模型G,G中的一个节点表示数据集中的一个数据点,其中任意两个节点之间边的权值就是相应两个数据点之间的距离,获取加权完全图G的权值矩阵:其中wij为节点vi与vj之间的边权值;步骤三:根据权值矩阵W(G)计算表示每个节点到其它所有节点的权重的和所组成的对角矩阵:其中,是节点vi的和其他所有节点之间的边权值之和;步骤四:计算加权完全图G的拉普拉斯矩阵:L(G)=X(G)‑W(G);步骤五:计算加权完全图G的拉普拉斯能量值:EL(G)=Σi=1nxi2+2Σi<jwi,j2;]]>步骤六:计算加权完全图G中任意节点vi的拉普拉斯中心性ci:ci=EL(G)-EL(Gi)EL(G)]]>其中,EL(Gi)为去掉节点vi后的拉普拉斯能量值;步骤七:对加权完全图G中任意节点vi,将该节点的ci值和其他节点的Laplacian中心性数值作比较,得到所有拉普拉斯中心性比ci高的节点集合,并计算节点vi与该集合中每个节点的距离的最小值δi;步骤八:计算所有节点的拉普拉斯中心性c和最小距离值δ,c和δ同时大于各自大数值阈值的节点就是类簇中心;步骤九:对所有的类簇中心贴上类簇标签,然后根据未分配类簇标签的节点的c和δ给出其应该归属的类簇;对某一个没有类簇标签的节点,归属到一个距离最近的有类簇标签的节点所属的类簇中,并获得该类簇的标签,对所有未分配类簇标签的节点循环这个过程直至所有的节点都被分配到相应的类簇为止,聚类完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710292849.4/,转载请声明来源钻瓜专利网。