[发明专利]一种二次聚类方法及系统无效

申请号：	201310581217.1	申请日：	2013-11-18
公开（公告）号：	CN103577602A	公开（公告）日：	2014-02-12
发明（设计）人：	侯德龙	申请（专利权）人：	浪潮（北京）电子信息产业有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	王丹;栗若木
地址：	100085 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种二次方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种二次聚类方法，其特征在于，包括以下步骤：

对数据流进行分块并读入数据块；

使用DBSCAN算法聚类，获得密度簇参考点；

对获取的所述密度簇参考点进行k-means算法聚类并采用分层的结构保存k-means算法聚类所获得的k均值参考点。

2.根据权利要求1所述的方法，其特征在于：

对数据流进行分块并读入数据块的过程为：在滑动窗口内实现对数据流的分块循环处理，并获取最终的聚类结果；如果数据未处理完，则读入下一数据块，直到数据流处理完为止。

3.根据权利要求1所述的方法，其特征在于：密度簇参考点的定义如下：

假设数据流中数据以块X1，X2，···，Xn，···的形式到达，每块都可以在内存中进行处理，每个数据块包含相同数目的数据点；

定义1：{|≠：密度簇参考点：对时刻t到达的数据块Xt，以基于密度的聚类算法进行聚类，生成k。(kt=1，2，···)个聚簇，均值点分别为cl，···，Ci，···，ek，则数据块将由k。个形如(ci，ni)的二元组构成，ni为Xi中隶属于ci的数据点数目，称rd(ei，ni)为数据流中的密度簇参考点。

4.根据权利要求1所述的方法，其特征在于：k均值参考点的定义如下：

假设数据流中数据以块X1，X2，···，Xn，···的形式到达，每块都可以在内存中进行处理，每个数据块包含相同数目的数据点；

定义2：k均值参考点：对m个密度簇参考点进行k均值聚类生成的2k个聚簇，均值点分别为cl，···，Ci，···，c2k，则数据块将由2k个形j／N(el，hi)的二元组构成，ni为隶属于ci的数据点数目，称rk(ci，ni)为数据流中的k均值参考点。

5.一种二次聚类系统，其特征在于，包括：

分块读入模块、密度簇参考点获取模块、k均值参考点获取模块；分块读入模块通过密度簇参考点获取模块与k均值参考点获取模块相连；

所述分块读入模块，用于对数据流进行分块并读入数据块；

所述密度簇参考点获取模块，用于使用DBSCAN算法聚类，获得密度簇参考点；

所述k均值参考点获取模块，用于对获取的所述密度簇参考点进行k-means算法聚类并采用分层的结构保存k-means算法聚类所获得的k均值参考点。

6.根据权利要求5所述的系统，其特征在于，

所述分块读入模块，还用于对数据流进行分块并读入数据块的过程为：在滑动窗口内实现对数据流的分块循环处理，并获取最终的聚类结果；如果数据未处理完，则读入下一数据块，直到数据流处理完为止。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载