[发明专利]一种非负矩阵分解聚类方法、装置及可读存储介质在审

专利信息
申请号: 202110997053.5 申请日: 2021-08-27
公开(公告)号: CN113705674A 公开(公告)日: 2021-11-26
发明(设计)人: 张斌;李瑞瑜;郭宇;张雪涛;王飞 申请(专利权)人: 西安交通大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 房鑫
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 矩阵 解聚 方法 装置 可读 存储 介质
【说明书】:

一种非负矩阵分解聚类方法、装置及可读存储介质,方法包括以下步骤:将输入数据映射到高维非线性空间;自适应学习高维非线性空间下数据的潜在拓扑关系,获得样本间的邻接矩阵,并以拓扑关系约束高维映射数据的非负分解结果矩阵,完成高维空间下子流形的聚类;通过分解非线性映射的样本矩阵得到系数矩阵,作为聚类标签,使用高维非线性空间下自适应学习得到的流形结构对其进行约束,获取高维非线性空间下的聚类结果。本发明还提供一种非负矩阵分解聚类装置及可读存储介质。本发明能够挖掘非负矩阵分解自身在数据中潜在的聚类特性,直接利用核技巧将数据高维映射特征的相似性结构信息应用于数据聚类,提升了数据聚类精度。

技术领域

本发明属于计算机技术领域,具体涉及一种非负矩阵分解聚类方法、装置及可读存储介质。

背景技术

在模式识别、数据挖掘和机器学习中,聚类能够获得数据的分布状况和簇的数据特征。聚类任务的关键是找到原始数据的内在结构信息,并使这种有效表示形式更具有区分度。现有的针对不同任务开发出来的谱聚类、K-means等很多聚类方法都在一定程度上依赖于数据的相似性衡量。

非负矩阵分解(NMF)作为图像处理的数据降维和特征提取中十分有效的方法,已经广泛应用于图像分析、语音处理、文本挖掘和聚类等领域。NMF通过找到两个乘积接近原始数据的非负矩阵来表达基于部分的数据,只允许对数据的加法组合。区别于含有负值分解结果(例如奇异值分解SVD,主成分分析PCA、独立成分分析ICA等)的矩阵分解方法在可解释性上的局限性,NMF的价值体现在对多元数据的分解是非负的,具有实现上的简便性、分解形式和分解结果上的可解释性。

由于非负矩阵分解本身潜在的聚类表征,研究者们提出了图正则化非负矩阵分解(GNMF)应用于聚类任务,利用数据的邻域关系作为图正则化对NMF加以几何结构信息。但是GNMF只能获取两个数据点之间的成对关系,而忽略了数据的非线性特征。因此,也有研究者提出了基于kernel的图正则化NMF(KNMF),在非线性NMF更新期间约束聚类矩阵的正交性,利用流形的非线性性质及其局部几何结构改善了聚类性能。

尽管上述方法运用了非负矩阵分解与聚类方法的等效性来完成聚类任务,但是,现有的大部分基于非负矩阵分解的图正则化方法通常都预先定义图邻接矩阵,进而对分解得到的系数矩阵进行约束完成聚类过程,因此忽略了一些相似性结构信息能够带来的价值,导致聚类性能欠佳。同时这些方法在目前并没有较好的邻居数或半径的确定方法,其度量方式通常取决于数据并且对噪声敏感。即使在一些最新的非负矩阵分解聚类方法中使用了图学习以获取相似信息来取代直接构造的图,但这些方法也通常是将相似性度量和数据聚类作为两个步骤执行的,因此无法获得最适用于聚类指标的相似信息。

发明内容

本发明的目的在于提供一种非负矩阵分解聚类方法、装置及可读存储介质,解决上述现有技术应用于聚类中无法自适应保留原始数据相似性结构信息以及易受噪声影响而导致的性能精度不稳定等问题。

为了实现上述目的,本发明有如下的技术方案:

第一方面,本发明的实施例提供一种非负矩阵分解聚类方法,包括以下步骤:

将输入数据映射到高维非线性空间;

自适应学习高维非线性空间下数据的潜在拓扑关系,获得样本间的邻接矩阵,并以拓扑关系约束高维映射数据的非负分解结果矩阵,完成高维空间下子流形的聚类;

通过分解非线性映射的样本矩阵得到系数矩阵,作为聚类标签,使用高维非线性空间下自适应学习得到的流形结构对其进行约束,获取高维非线性空间下的聚类结果。

作为本发明非负矩阵分解聚类方法的一种优选方案,所述的自适应学习高维非线性空间下数据集的潜在拓扑关系,获得样本间的邻接矩阵具体包括:

使用全局结构保留方法映射子空间与原高维非线性空间的结构相似度进行获取。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110997053.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top