[发明专利]基于图论的k-means非线性流形聚类与代表点选取方法有效

申请号：	201310508232.3	申请日：	2013-10-24
公开（公告）号：	CN103617609A	公开（公告）日：	2014-03-05
发明（设计）人：	屠恩美;杨杰	申请（专利权）人：	上海交通大学
主分类号：	G06T7/00	分类号：	G06T7/00
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	郭国中
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 means 非线性流形代表选取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图论的k-means非线性流形聚类与代表点选取方法，其特征在于，首先使用要聚类的样本集构建一个图模型，然后在图模型上交替更新类别中心和更新各类成员，直至收敛，收敛后的中心既是要选取的代表点，同时与各代表点具有相同类别标号的样本点为一类；其中：

在更新类别中心时，限制类别中心为图上的节点，在每次的更新中选取某个类别中的一个成员作为聚类中心，使得它与所在类别中所有其他成员的图距离之和最小；

在更新样本所属类别时，使用无限次随机游走概率作为样本和中心间的相似性度量，无限次随机游走概率矩阵计算方法如下：

其中I为单位矩阵，α是小于1的正数，P＝D^-1W为随机游走转移矩阵，其中W为所构建图模型的邻接矩阵，D为对角矩阵，其对角元为对应的W行和，无限次随机游走概率矩阵中的第i行第j列元素表示样本集中第i个样本到第j个样本的无限次随机游走概率。

2.根据权利要求1所述的一种基于图论的k-means非线性流形聚类与代表点选取方法，其特征在于，所述更新类别中心，具体为：对于给定的样本集合，首先计算样本两两之间的欧式距离得到一个距离矩阵，然后利用此距离矩阵计算出样本两两之间的图距离，获得一个图距离矩阵，记为D_G；对于第k类的聚类中心，采用如下方法决定聚类中心：

ck=argminxj,j∈Ck12Σi∈CkdG(xj,xi),k=1..K]]>

其中C_k为第k类中所包含样本的序号集合，d_G(x_i,x_j)为样本x_i到x_j得图距离，c_k为第k类的中心样本，K为给定的类别数目；即对于每一类，选取距离该类中的某一个样本，使得它到所有其他样本的图距离之和最小，然后以此样本作为本次迭代的类中心；因为对应于某一类的图距离矩阵实际上是总体图距离矩阵D_G的一个主对角子矩阵，因此上述优化问题可最终转换为如下的简单最值问题：

ck=xj,j=argmini=1..|Ck|[DGke]i,j∈Ck]]>

其中是对应于第k类的图距离矩阵，e为全1向量，C_k为第k类中所包含样本的序号集合，c_k为第k类的中心样本。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310508232.3/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于图论的k-means非线性流形聚类与代表点选取方法有效

专利文献下载