[发明专利]一种基于拉普拉斯中心性的峰值聚类方法在审

专利信息
申请号: 201710292849.4 申请日: 2017-04-28
公开(公告)号: CN107194415A 公开(公告)日: 2017-09-22
发明(设计)人: 杨旭华;陈果;朱钦鹏 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 杭州斯可睿专利事务所有限公司33241 代理人: 王利强
地址: 310014 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 拉普拉斯 心性 峰值 方法
【说明书】:

技术领域

发明涉及到机器学习领域,特别是指一种基于拉普拉斯中心性的峰值聚类方法。

背景技术

机器学习是人工智能领域中十分活跃的一个重要分支,其研究目标主要是让计算机模拟或实现人类的学习行为,以获取新的知识或技能。聚类方法属于机器学习中的无监督学习算法,可以提取数据内在的隐含结构,将具有相似性属性的数据点聚成一个类簇,类簇内部的数据点具有较大的相似性,而不同类簇的数据点相似性比较低。聚类方法在计算机和其他学科的许多领域具有广泛的应用价值。

研究者们在聚类算法上已经做出了很多有益的工作,比如基于划分的聚类算法:K-means是基于一个优化的目标函数通过反复迭代,降低目标函数的差异值,当目标函数逐渐收敛,划分完成K个类簇,算法缺点是要先验地指定类簇数目K或类簇中心,聚类的鲁棒性不高;基于密度聚类算法:DBSCAN算法是基于密度的空间聚类算法,该算法采用空间索引技术来搜索对象的邻域,引入了“核心对象”和“密度可达”等概念,从核心对象出发,把所有密度可达的对象组成一个类簇。算法优点是聚类速度快且能够有效处理噪声点和发现任意形状的空间类簇,缺点是仍然是需要预先指定参数,算法的鲁棒性不好。一种新的基于Delta-Density的聚类算法(DDC)最近在Science发表,算法的核心思想是巧妙地提出和利用了密度和一个基于距离的新指标δ去快速地发现高密度节点峰值。具有高密度和高δ值的节点被确信为类簇中心。然后,再把除去类簇中心的节点逐步地分配到已经确信的类簇中心,直至完成类簇的划分,实验结果表明其具有良好的聚类效果。DDC算法的缺点是需要事先给定一个经验参数截断距离,该参数对聚类性能影响巨大但没有一个有效地估计其合适数值的方法等;基于层次的聚类算法:BIRCH算法利用树结构对数据集进行处理,叶结点存储一个聚类,用中心和半径表示,顺序处理每一个对象,并把它划分到距离最近的结点,该算法也可以作为其他聚类算法的预处理过程。算法缺点是对输入数据的先后顺序敏感,鲁棒性不高;基于网格的聚类算法:CLIQUE算法是一种结合了网格和密度的聚类算法,利用自顶向上方法求出各个子空间的聚类单元;算法缺点是空间和时间效率都较低,需要输入的参数具有不确定性。当然还有很多其他的聚类算法,像基于自组织神经网络和基于统计方法的聚类算法等。

发明内容

为了克服已有聚类方法精确度不高、需要提前设定参数等不足之处,本发明提出一种聚类精确度高、无需提前设定参数的基于拉普拉斯中心性的峰值聚类方法。

本发明解决其技术问题所采用的技术方案是:

一种基于拉普拉斯中心性的峰值聚类方法,包括以下步骤:

步骤一:建立数据集模型D={vi},i=1…n,其中vi为数据集D中的任意数据点,数据点vi和vj之间的距离值为dij

步骤二:将待分类数据集D转化成为一个加权完全图模型G,G中的一个节点表示数据集中的一个数据点,其中任意两个节点之间边的权值就是相应两个数据点之间的距离,获取加权完全图G的权值矩阵:

其中wi,j为节点vi与vj之间的边权值;

步骤三:根据权值矩阵W(G)计算表示每个节点到其它所有节点的权重的和所组成的对角矩阵:

其中,是节点vi的和其他所有节点之间的边权值之和;

步骤四:计算加权完全图G的拉普拉斯矩阵:

L(G)=X(G)-W(G);

步骤五:计算加权完全图G的拉普拉斯能量值:

步骤六:计算加权完全图G中任意节点vi的拉普拉斯中心性ci

其中,EL(Gi)为去掉节点vi后的拉普拉斯能量值;

步骤七:对加权完全图G中任意节点vi,将该节点的ci值和其他节点的Laplacian中心性数值作比较,得到所有拉普拉斯中心性比ci高的节点集合,并计算节点vi与该集合中每个节点的距离的最小值δi

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710292849.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top