[发明专利]一种基于边界环收缩的聚类系统及方法在审
申请号: | 202110477832.2 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113486916A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 马弢 | 申请(专利权)人: | 中国航天空气动力技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 胡健男 |
地址: | 100074 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 边界 收缩 系统 方法 | ||
本发明一种基于边界环收缩的聚类系统及方法,系统包括:边界点检测模块、边界聚合模块和边界环收缩模块:边界点检测模块,对于待聚类的数据点,采用边界点检测算法确定属于边界点的数据点,形成边界点集合P,从而获取聚类边界点;边界聚合模块,对边界点检测模块得到的边界点集合P,根据聚类数目k对边界点集合P进行边界聚合,即将边界点集合P,根据聚类数目k,划分为若干的新集合,每个新集合为每个聚类的边界,为每个新集合分配一个标签,且每个新集合分配的标签不同;边界环收缩模块,对于各个新集合形成的边界内的未标记点进行标签分配,完成对该新集合所有待聚类的数据点的标签分配,从而实现聚类。
技术领域
本发明涉及一种基于边界环收缩的聚类系统及方法,属于机器学习聚类技术领域。
背景技术
聚类,即将在特征空间中没有标签的数据点,依据其自身的特点,聚集为若干的集合,属于同一集合内的数据点相似,属于不同集合的数据点之间差异性大。在人工智能不断发展的这个时代,由于很难获得大量的带有标签的样本,因此无监督的聚类算法正在受到越来越多的关注,作为一种有效的数据与信息挖掘手段,聚类在诸如人脸识别、网页推荐系统等领域已经被成功使用。
一般的聚类算法是一个将寻找聚类中心与分配聚类标签这两项内容交互迭代优化的过程,聚类的思路也经常局限于优化聚类中心,可是聚类的终极目标是要为数据点分配聚类标签,近年来学者开始研究聚类边界的检测方法,但是通常将检测到的边界点作为聚类中心的辅助信息,且使用方法较为复杂,导致标签的分配过程较为耗时。
发明内容
本发明解决的技术问题为:克服上述现有技术的不足,提供一种基于边界环收缩的聚类系统及方法,提高了标签分配速度和准确性。
本发明解决的技术方案为:一种基于边界环收缩的聚类系统,包括:边界点检测模块、边界聚合模块和边界环收缩模块:
边界点检测模块,对于待聚类的数据点,采用边界点检测算法确定属于边界点的数据点,形成边界点集合P,从而获取聚类边界点;
边界聚合模块,对边界点检测模块得到的边界点集合P,根据聚类数目k对边界点集合P进行边界聚合,即将边界点集合P,根据聚类数目k,划分为若干的新集合,每个新集合为每个聚类的边界,为每个新集合分配一个标签,且每个新集合分配的标签不同;
边界环收缩模块,对于各个新集合形成的边界内的未标记点进行标签分配,完成对该新集合所有待聚类的数据点的标签分配,从而实现聚类。
优选的,边界点集合P表示为{p1,p2,...,pn},从而获取聚类边界点;p1,p2,...,pn分别为第1个边界点、第2个边界点、…、第n个边界点;n小于等于待聚类的数据点的总数。
优选的,根据聚类数目k,划分为若干的新集合,每个新集合为每个聚类的边界,为每个新集合分配一个标签,且每个新集合分配的标签不同;具体如下:
当已知聚类数目k时,采用分层聚类算法将边界点集合P中的边界点根据聚类数目k进行聚合,形成k个新集合,每个新集合中为聚类数目k中一类的边界点,为每个新集合分配一个标签,且每个新集合分配的标签不同;
当聚类数目未知时,采用图论的方法,将边界点集合P中的边界点作为图的节点,将图的节点中的任意两个之间距离的倒数作为边的权值,然后使用最大流最小割的方法将图的所有节点即对应的边界点划分为若干新集合,每个新集合分配一个标签,且每个新集合分配的标签不同;新集合的数目即为聚类数目k。
优选的,边界环收缩模块,对于各个新集合形成的边界内的未标记点进行标签分配,对其中任意一个新集合形成的边界内的未标记点进行标签分配,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航天空气动力技术研究院,未经中国航天空气动力技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110477832.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力输送用报警系统
- 下一篇:一种预防前挡风玻璃低温结冰的控制方法