[发明专利]基于图论的k-means非线性流形聚类与代表点选取方法有效

专利信息
申请号: 201310508232.3 申请日: 2013-10-24
公开(公告)号: CN103617609A 公开(公告)日: 2014-03-05
发明(设计)人: 屠恩美;杨杰 申请(专利权)人: 上海交通大学
主分类号: G06T7/00 分类号: G06T7/00
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 means 非线性 流形 代表 选取 方法
【权利要求书】:

1.一种基于图论的k-means非线性流形聚类与代表点选取方法,其特征在于,首先使用要聚类的样本集构建一个图模型,然后在图模型上交替更新类别中心和更新各类成员,直至收敛,收敛后的中心既是要选取的代表点,同时与各代表点具有相同类别标号的样本点为一类;其中:

在更新类别中心时,限制类别中心为图上的节点,在每次的更新中选取某个类别中的一个成员作为聚类中心,使得它与所在类别中所有其他成员的图距离之和最小;

在更新样本所属类别时,使用无限次随机游走概率作为样本和中心间的相似性度量,无限次随机游走概率矩阵计算方法如下:

其中I为单位矩阵,α是小于1的正数,P=D-1W为随机游走转移矩阵,其中W为所构建图模型的邻接矩阵,D为对角矩阵,其对角元为对应的W行和,无限次随机游走概率矩阵中的第i行第j列元素表示样本集中第i个样本到第j个样本的无限次随机游走概率。

2.根据权利要求1所述的一种基于图论的k-means非线性流形聚类与代表点选取方法,其特征在于,所述更新类别中心,具体为:对于给定的样本集合,首先计算样本两两之间的欧式距离得到一个距离矩阵,然后利用此距离矩阵计算出样本两两之间的图距离,获得一个图距离矩阵,记为DG;对于第k类的聚类中心,采用如下方法决定聚类中心:

ck=argminxj,jCk12ΣiCkdG(xj,xi),k=1..K]]>

其中Ck为第k类中所包含样本的序号集合,dG(xi,xj)为样本xi到xj得图距离,ck为第k类的中心样本,K为给定的类别数目;即对于每一类,选取距离该类中的某一个样本,使得它到所有其他样本的图距离之和最小,然后以此样本作为本次迭代的类中心;因为对应于某一类的图距离矩阵实际上是总体图距离矩阵DG的一个主对角子矩阵,因此上述优化问题可最终转换为如下的简单最值问题:

ck=xj,j=argmini=1..|Ck|[DGke]i,jCk]]>

其中是对应于第k类的图距离矩阵,e为全1向量,Ck为第k类中所包含样本的序号集合,ck为第k类的中心样本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310508232.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top