[发明专利]基于图论的k-means非线性流形聚类与代表点选取方法有效
申请号: | 201310508232.3 | 申请日: | 2013-10-24 |
公开(公告)号: | CN103617609A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 屠恩美;杨杰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 means 非线性 流形 代表 选取 方法 | ||
1.一种基于图论的k-means非线性流形聚类与代表点选取方法,其特征在于,首先使用要聚类的样本集构建一个图模型,然后在图模型上交替更新类别中心和更新各类成员,直至收敛,收敛后的中心既是要选取的代表点,同时与各代表点具有相同类别标号的样本点为一类;其中:
在更新类别中心时,限制类别中心为图上的节点,在每次的更新中选取某个类别中的一个成员作为聚类中心,使得它与所在类别中所有其他成员的图距离之和最小;
在更新样本所属类别时,使用无限次随机游走概率作为样本和中心间的相似性度量,无限次随机游走概率矩阵计算方法如下:
其中I为单位矩阵,α是小于1的正数,P=D-1W为随机游走转移矩阵,其中W为所构建图模型的邻接矩阵,D为对角矩阵,其对角元为对应的W行和,无限次随机游走概率矩阵中的第i行第j列元素表示样本集中第i个样本到第j个样本的无限次随机游走概率。
2.根据权利要求1所述的一种基于图论的k-means非线性流形聚类与代表点选取方法,其特征在于,所述更新类别中心,具体为:对于给定的样本集合,首先计算样本两两之间的欧式距离得到一个距离矩阵,然后利用此距离矩阵计算出样本两两之间的图距离,获得一个图距离矩阵,记为DG;对于第k类的聚类中心,采用如下方法决定聚类中心:
其中Ck为第k类中所包含样本的序号集合,dG(xi,xj)为样本xi到xj得图距离,ck为第k类的中心样本,K为给定的类别数目;即对于每一类,选取距离该类中的某一个样本,使得它到所有其他样本的图距离之和最小,然后以此样本作为本次迭代的类中心;因为对应于某一类的图距离矩阵实际上是总体图距离矩阵DG的一个主对角子矩阵,因此上述优化问题可最终转换为如下的简单最值问题:
其中是对应于第k类的图距离矩阵,e为全1向量,Ck为第k类中所包含样本的序号集合,ck为第k类的中心样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310508232.3/1.html,转载请声明来源钻瓜专利网。