[发明专利]基于图论的k-means非线性流形聚类与代表点选取方法有效
申请号: | 201310508232.3 | 申请日: | 2013-10-24 |
公开(公告)号: | CN103617609A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 屠恩美;杨杰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于图论的k-means非线性流形聚类和代表点选取方法,具体包括以下步骤,构建一个图模型,计算各样本点间的图距离矩阵以及无限次随机游走概率矩阵,然后在图模型上交替迭代更各类中心以及类成员直至收敛。本发明所提出的疲劳随机游走模型可以快速实现非线性的流行聚类并为每类选取一个代表点,从而克服传统k-means只在样本服从高斯分布时能够取得好效果的缺陷。本发明对图像、文本以及视频等具有低维流形分布的高维数据具有很好的聚类效果,同时能够为每类指定一个最具代表性的点,方法实现简单,易于操作。 | ||
搜索关键词: | 基于 means 非线性 流形 代表 选取 方法 | ||
【主权项】:
1.一种基于图论的k-means非线性流形聚类与代表点选取方法,其特征在于,首先使用要聚类的样本集构建一个图模型,然后在图模型上交替更新类别中心和更新各类成员,直至收敛,收敛后的中心既是要选取的代表点,同时与各代表点具有相同类别标号的样本点为一类;其中:在更新类别中心时,限制类别中心为图上的节点,在每次的更新中选取某个类别中的一个成员作为聚类中心,使得它与所在类别中所有其他成员的图距离之和最小;在更新样本所属类别时,使用无限次随机游走概率作为样本和中心间的相似性度量,无限次随机游走概率矩阵计算方法如下:
其中I为单位矩阵,α是小于1的正数,P=D-1W为随机游走转移矩阵,其中W为所构建图模型的邻接矩阵,D为对角矩阵,其对角元为对应的W行和,无限次随机游走概率矩阵中的第i行第j列元素表示样本集中第i个样本到第j个样本的无限次随机游走概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310508232.3/,转载请声明来源钻瓜专利网。