[发明专利]聚类方法和装置在审

专利信息
申请号: 201710329774.2 申请日: 2017-05-11
公开(公告)号: CN108875760A 公开(公告)日: 2018-11-23
发明(设计)人: 赖晓虎;彭玉军;张家兴;李梁;杜成宝 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 林祥
地址: 英属开曼群岛大开*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结果属性 聚类结果 聚类 集合 方法和装置 划分结果 聚类分析 聚类算法 约束条件 设置点 限制点 申请 收敛 分析
【说明书】:

本申请提供一种聚类方法,用于对某个集合的点进行类别划分,所述方法包括:获取集合中部分点的指定结果属性,所述指定结果属性用来限制点的类别划分结果;以集合中部分点的指定结果属性为约束条件运行聚类算法,得到符合所述指定结果属性的聚类结果。通过本申请的技术方案,使得分析人员可以通过设置点的指定结果属性来对聚类结果产生影响,从而将聚类结果导向符合分析需求的方向,在提升聚类质量的同时,加快了聚类分析的收敛速度。

技术领域

本申请涉及数据处理技术领域,尤其涉及一种聚类方法和装置。

背景技术

随着信息技术越来越广泛的应用,生产、生活的任何一个环节都在持续产生数据,收集和存储的数据量在不断膨胀。通过数据挖掘从海量数据中找出有意义的模式或规则,为信息管理、查询优化、商业决策和过程控制等提供辅助支持,成为利用数据的重要方式。

聚类分析是数据挖掘的一种手段,聚类是按数据记录的内在相似性将数据集(也称点集,每个点为一个数据记录)划分为多个类别,使类别内的点相似度较大而类别间的点相似度较小。目前已经存在多种聚类算法,对于某个确定的点集,分析人员在确定所采用的聚类算法、指定该聚类算法的参数后,即可运行聚类算法得到一种聚类结果。采用不同的聚类算法、或者为同一个聚类算法设置不同的算法参数,通常可以得到不同的聚类结果。

现有技术中,聚类结果完全取决于聚类算法的运行结果。如果分析人员对聚类结果不满意,或者更换聚类算法,或者修改聚类算法的参数。这样,得到满意的聚类结果常常需要很多次的尝试,有时甚至多次尝试也得不到期望的类别划分结果,聚类分析的效率和质量都无法保障。

发明内容

有鉴于此,本申请提供一种聚类方法,用于对某个集合的点进行类别划分,所述方法包括:

获取集合中部分点的指定结果属性,所述指定结果属性用来限制点的类别划分结果;

以集合中部分点的指定结果属性为约束条件运行聚类算法,得到符合所述指定结果属性的聚类结果。

本申请还提供了一种聚类装置,用于对某个集合的点进行类别划分,所述装置包括:

指定结果属性获取单元,用于获取集合中部分点的指定结果属性,所述指定结果属性用来限制点的类别划分结果;

聚类算法运行单元,用于以集合中部分点的指定结果属性为约束条件运行聚类算法,得到符合所述指定结果属性的聚类结果。

由以上技术方案可见,本申请的实施例中,采用指定结果属性来限制集合中部分点的类别划分结果,并以此为约束条件运行聚类算法,使得分析人员可以通过设置点的指定结果属性来对聚类结果产生影响,从而将聚类结果导向符合分析需求的方向,在提升聚类质量的同时,加快了聚类分析的收敛速度。

附图说明

图1是本申请实施例中一种聚类方法的流程图;

图2是本申请应用示例中一种问句分类的流程图;

图3是本申请应用示例中一种可视化图像显示界面的示例图;

图4是运行本申请实施例的设备的一种硬件结构图;

图5是本申请实施例中一种聚类装置的逻辑结构图。

具体实施方式

本申请的实施例提出一种新的聚类方法,可以为待划分集合中的部分点设置指定结果属性,在运行聚类算法时将指定属性结果作为类别划分的约束条件,这样分析人员可以通过限制部分点的类别划分,对聚类结果直接施加影响,相比于更换聚类算法或修改聚类算法的参数,不仅能够更快的得到符合实际需求的聚类结果,而且得到的聚类结果质量更高,从而解决现有技术中存在的问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710329774.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top