[发明专利]一种不完整数据的子空间聚类方法及装置在审

专利信息
申请号: 202110731636.3 申请日: 2021-06-29
公开(公告)号: CN113344126A 公开(公告)日: 2021-09-03
发明(设计)人: 陈川;郑子彬 申请(专利权)人: 中山大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/16
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 黄忠
地址: 510275 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 完整 数据 空间 方法 装置
【说明书】:

本申请公开了一种不完整数据的子空间聚类方法及装置,包括:将获取的不完整数据按照预置规则进行排列,不完整数据包括多媒体数据;采用基于转换的张量核范数的张量优化问题将排列后的不完整数据投影到低维的子空间;采用交替迭代算法求解张量优化问题,得到子空间表示张量的相似矩阵;采用谱聚类算法基于求得的相似矩阵,得到不完整数据的聚类结果。本申请能够在保存不完整数据的空间结构下进行聚类,并能寻找较低秩的表示张量以充分的探索数据的全局相关性。

技术领域

本申请涉及数据聚类技术领域,尤其涉及一种不完整数据的子空间聚类方法及装置。

背景技术

在计算机视觉领域,数据识别问题的研究是基础问题,例如:数据的聚类问题。现有的数据聚类方法大多假设收集到的数据是完整的,但在数据的获取和传输过程中,由于获取设备和人为因素的影响,观测数据一般都是不完整的,并且带有噪声。另外由于互联网的发展,每天都能得到大量数据,但这些数据之间一般是冗余的,基于子空间的聚类方法把收集到的大量数据投影到较低维的子空间,以至于得到的每个子空间代表数据的一类。

对于高维数据聚类,子空间聚类方法已经被广泛研究,特别是基于谱聚类的方法。谱聚类的方法由两步组成。首先,根据数据两两之间的关系,建立相似矩阵。然后,谱聚类方法(Ncut,Ratio)应用在相似矩阵上得到最终的聚类结果。

现有技术中聚类方法数据往往是不完整的,并包含有噪声,如果直接利用观测数据,则会达到较差的聚类结果。

对于图像数据,现有的一些方法一般把收集到的图像数据拉成列向量后再用基于矩阵的子空间聚类方法进行聚类,但拉成列向量这一操作会破坏图像的空间信息和特征,造成用户识别差。

另外,在计算机视觉和模式识别领域,特征融合方法可以提高数据识别,所以如何融合收集数据的特征,以得到较紧的子空间表示,可以提高聚类结果。具体来说,融合多特征通常比单一特征具有更好的分类性能,通过融合操作或算法使用数据的多角度、多层次的特征、全局特征和局部特征、空间特征和时间特征,可以实现更智能的数据分类。

发明内容

本申请实施例提供了一种不完整数据的子空间聚类方法及装置,使得在保存不完整数据的空间结构下进行聚类,并能寻找较低秩的表示张量以充分的探索数据的全局相关性。

鉴于此,本申请第一方面提供了一种不完整数据的子空间聚类方法,所述方法包括:

将获取的不完整数据按照预置规则进行排列,所述不完整数据包括多媒体数据;

采用基于转换的张量核范数的张量优化问题将排列后的所述不完整数据投影到低维的子空间;

采用交替迭代算法求解所述张量优化问题,得到子空间表示张量的相似矩阵;

采用谱聚类算法基于求得的所述相似矩阵,得到所述不完整数据的聚类结果。

可选的,所述将获取的不完整数据按照预置规则进行排列,包括:

将n2个二维的不完整数据n1*n3进行顺序排列,形成一个三阶张量n1*n3*n2

将三阶张量n1*n3*n2进行旋转,得到n1*n2*n3三阶张量。

可选的,所述张量优化问题为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110731636.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top