[发明专利]不完备多视图聚类方法、系统、设备以及存储介质在审

专利信息
申请号: 202310291172.8 申请日: 2023-03-17
公开(公告)号: CN116361670A 公开(公告)日: 2023-06-30
发明(设计)人: 崔国盛;李烨;吴丹 申请(专利权)人: 中国科学院深圳先进技术研究院
主分类号: G06F18/23 分类号: G06F18/23;G06F18/2133
代理公司: 深圳市科进知识产权代理事务所(普通合伙) 44316 代理人: 张桂平
地址: 518055 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 完备 视图 方法 系统 设备 以及 存储 介质
【说明书】:

发明涉及一种不完备多视图聚类方法、系统、设备以及存储介质,其中,所述一种不完备多视图聚类方法包括:a.将原始多视图数据矩阵在所提出的基于逐层范数补偿和超图正则的深度不完备非负矩阵分解框架下分解;b.对分解后的多视图数据矩阵进行聚类。本发明还涉及一种不完备多视图聚类系统。本发明能够更有效地对数据进行拟合,得到更有效的不完备多视图数据融合特征,并获得更好的聚类结果。

技术领域

本发明涉及一种不完备多视图聚类方法、系统、设备以及存储介质。

背景技术

随着信息技术的飞速发展,多视图学习问题在多媒体检索、高光谱图像分类、多组学数据分析、医疗数据分析等领域得到了广泛的研究。多视图学习的关键是充分利用多个视图之间的互补信息,方便后续的数据处理任务。在过去的几十年里,不完备多视图聚类已经取得了显著的进展,其是基于完备多视图假设,即每个视图均不存在样本的缺失。然而,在实际应用中并非总是如此,收集的多视图数据集可能是不完整的,例如某些视图缺少一些样本。这就导致了不完备多视图聚类(incomplete multiview clustering,IMC)问题。

基于图的IMC模型通过融合多个不完备视图的图矩阵得到聚类结果。文献[1]提出了不完备多模态分组模型,通过优化共享的完备图拉普拉斯项得到融合表征,在优化过程中同时更新相似度矩阵,该方法只能处理包含两个视图的数据。文献[2]中提出了一个基于低秩表示学习的IMC模型,通过低秩表示学习每个视图的低维表征,并通过将各视图的低维表征与一致表征矩阵对齐实现多视图表征的融合。通常,基于图的IMC方法可以得到比较好的聚类结果,但这些方法的计算成本也很大。

由于基于图的IMC模型计算复杂度很高,矩阵分解是解决IMC问题的另一种常见技术。早期基于矩阵分解的IMC模型只能处理包含两个视图的数据。为了可以应对包含更多视图的数据,文献[3]首先用各视图的平均值填充缺失视图,并引入对角加权矩阵缓解缺失视图的负面影响。与上述工作不同,文献[4]提出图正则部分不完备多视图聚类,通过引入一个共同一致矩阵对齐不完备多视图。

矩阵分解只是将原始数据矩阵分解为两个因子矩阵,如此可能会限制其学习更复杂和更高层次的信息。为此,近年来发展了许多基于深度矩阵分解(包括深度半非负矩阵分解、深度非负矩阵分解和深度概念分解)的不完备多视图聚类方法[5][6][7]。然而,上述这些都是为完备的多视图数据开发的,不能直接用于不完备的多视图数据。上述方法的另一个问题是由于随机初始化可能存在数值不稳定性问题。因此,通常需要一层一层的预训练,以确保模型能产生合理的结果。例如,文献[5][7]中的深度半非负矩阵分解用半非负矩阵分解初始化每一层中的因子矩阵。在文献[6]中,则用k-means算法对深度半非负矩阵分解进行每一层的初始化。此外,基于矩阵分解/深度矩阵分解的IMC方法通常采用k最近邻图拉普拉斯挖掘数据的几何信息。与上述传统图相比,超图可以对数据点之间的高阶关系进行建模,提供更多的信息,对于每个视图都存在缺失的IMC问题是必要的。例如,在文献[8][9]中,超图被用于提高不完全多模态数据分类的性能。

当前深度(半)非负矩阵分解模型都是面向完备多视图数据提出的,不能处理不完备多视图数据的聚类问题。此外,这些深度矩阵分解模型对随机初始化不鲁棒,需要逐层用浅层模型进行初始化来保证模型的稳定分解。另外,目前不完备多视图聚类模型多采用k近邻图发掘数据的几何结构信息,无法发掘数据间的高阶结构信息。

[1]H.Zhao,H.Liu,and Y.Fu,“Incomplete multi-modal visualdatagrouping.”in Proc.25th Int.Joint Conf.Artif.Intel.(IJCAI),2016,pp.2392–2398.

[2]J.Wen,Y.Xu,and H.Liu,“Incomplete multiview spectral clusteringwithadaptive graph learning,”IEEE Trans.Cybern.,vol.50,no.4,pp.1418–1429,2018.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310291172.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top