[发明专利]K平均聚类的增强方法在审

申请号：	201610915609.0	申请日：	2016-10-21
公开（公告）号：	CN106485285A	公开（公告）日：	2017-03-08
发明（设计）人：	赵万磊;邓称浩	申请（专利权）人：	厦门大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	厦门南强之路专利事务所(普通合伙)35200	代理人：	马应森
地址：	361005 ***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	K平均聚类的增强方法，涉及机器学习的数据聚类。包括以下步骤1)给定n个待聚类数据，目标聚类数为k个；2)初始化k个聚类中心；3)将一个数据的类标签换成另一个类标签，使得预先定义的优化函数值增大；4)重复步骤3)直到目标函数无法再获得更高的函数值，或达到指定的迭代次数。抛弃传统初始化策略使得聚类更快，而且提高了聚类质量；优化函数直接驱动聚类得到了比传统聚类小很多的误差；聚类过程中，可以不用每次为每个数据赋予最佳的类。这一改变使得聚类速度更快，而且收敛到更好的局部最优点；应用到自顶向下的二分层次聚类上，可以极大的降低聚类复杂度。
搜索关键词：	平均增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

K平均聚类的增强方法，其特征在于包括以下步骤：1)给定n个待聚类数据，目标聚类数为k个；2)初始化k个聚类中心，具体方法如下：(1)完全随机策略：给定待聚类的n条数据，每条数据分配一个随机的从1到k的类标签；(2)随机中心：采用传统K平均初始化方式，先随机从数据中选取k个作为初始的聚类中心，为每个数据在k个中心中寻找最近的聚类中心，该中心所代表的类的标签将赋予该数据；3)将一个数据的类标签换成另一个类标签，使得预先定义的优化函数值增大，更换一个数据的类标签的方法如下两种：(1)快速策略：随机选取一个数据，尝试改变当前数据所属的类到另一个类，若能使目标函数的值变大，则更新这个数据所属的类到另一个类，重复此尝试，直到n条数据都被尝试更改类标签一次且仅一次；(2)最优策略：随机选取一个数据，尝试改变当前数据的类标签为另一个类，如此尝试k‑1次，找到能使目标函数获得最大增益且增益为正，如此，更新这个数据所属的类到获得最大增益的那个类的类标签；重复此尝试，直到n条数据都被逐一尝试更改类标签一次且仅一次；在两种更新策略中，使用同一目标函数：Max.Σr=1kDr′Drnr,---(1)]]>其中，Sr表示属于第r类的数据集合，xi表示第i个数据对应的向量表示；Dr表示属于第r个类的所有数据对应向量的和；nr表示属于第r个类的向量的数目；4)重复步骤3)直到公式(1)中的目标函数无法再获得更高的函数值，或达到指定的迭代次数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门大学，未经厦门大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610915609.0/，转载请声明来源钻瓜专利网。

上一篇：一种基于模板匹配的元件定位方法
下一篇：一种基于局部敏感判别的矩阵分类模型

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]K平均聚类的增强方法在审

专利文献下载