[发明专利]基于误差鲁棒和低秩张量逼近的多视图聚类方法在审
申请号: | 202111243426.6 | 申请日: | 2021-10-25 |
公开(公告)号: | CN113988168A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 张琳娜;王淑琴;岑翼刚;张兰尧 | 申请(专利权)人: | 贵州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/762;G06V10/74 |
代理公司: | 贵州派腾知识产权代理有限公司 52114 | 代理人: | 宋妍丽 |
地址: | 550000 *** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 误差 张量 逼近 视图 方法 | ||
一种基于误差鲁棒和低秩张量逼近的多视图聚类方法,首先计算所有视图的转移概率矩阵,然后将它们作为三阶张量的额叶切片进行搜索以捕获多视图信息,最后将其分解为具有张量核范数约束的理想张量和误差项。此外,该方法在误差项上施加G1和l2,1范数进行错误学习,以便可以清晰地表征和处理各种错误。通过本发明,将多个视图的转移概率矩阵构造成三维张量进行张量低秩约束以探索多个视图的高阶相关性;对误差项施加G1和l2,1范数约束可以滤除各种噪声的组合;对构造的转移概率张量旋转之后进行低秩求解提高了运行效率。
技术领域
本发明涉及图像处理技术领域,具体涉及到多个视图特征的聚类方法,尤其涉及一种基于误差鲁棒和低秩张量逼近的多视图聚类方法。
背景技术
现实生活中不同渠道获取的多视图数据无处不在,例如,图像通常用颜色,纹理和边缘特征来描述;文档可以被翻译成不同的语言。来自不同视图的特征具有互补性,因为每个视图通常表征原始对象的部分信息。因此多视图聚类由于能够探索数据中包含的多种特征被应用到多个领域,例如面部聚类,人体行为识别,图像表示等。
目前专门针对多视图聚类的方法主要分为基于K-means的方法,基于图的方法和基于谱聚类的方法。基于K-means的方法主要是采用欧氏距离来衡量样本与各个簇的相似度,需要预先设定K值。基于图的方法通过在原始特征空间中构建数据间的相似度,对于离群点和噪音点敏感。而基于谱聚类的方法对相似度矩阵对应的拉普拉斯矩阵找一个低维嵌入表达,同时能够基于矩阵分解的思想滤除噪声。因此,基于谱聚类的方法更具鲁棒性,在实际应用中能够有效滤除各种噪声和离群点的影响以实现精准聚类。但是,对于分解后的相似度矩阵和噪声项进行有效的约束成为了关键。
发明内容
本发明的目的是提供一种基于误差鲁棒和低秩张量逼近的多视图聚类方法,对所获取的多视图特征,利用矩阵分解的思想获得多视图特征的低秩张量,并作为谱聚类的输入来进行聚类,旨在解决上述技术问题。
为实现上述目的,本发明提出一种基于误差鲁棒和低秩张量逼近的多视图聚类方法,包括以下步骤:
步骤1:输入M个多视图特征矩阵建立每个视图的相似度矩阵S(v)∈RN×N;
步骤2:计算每个视图的转移概率矩阵P(v)∈RN×N,将每个视图的转移概率矩阵当作一个额叶切片堆叠在一起来构造转移概率张量P∈RN×N×M;
步骤3:将转移概率张量P∈RN×N×M分解为Z∈RN×N×M和E∈RN×N×M,对Z∈RN×N×M和E∈RN×N×M施加张量核范数,G1和l2,1范数约束进行建模,最终通过迭代优化输出无噪声转移概率张量Z∈RN×N×M;
其中:Z∈RN×N×M是无噪声转移概率张量,E∈RN×N×M是误差张量;
步骤4:计算输出的无噪声转移概率张量Z∈RN×N×M对应的转移概率矩阵Z∈RN×N,然后计算转移概率矩阵Z∈RN×N的拉普拉斯矩阵L∈RN×N;步骤4还包括:
步骤4-1:计算拉普拉斯矩阵L∈RN×N最小的r个广义特征向量,并构成矩阵U;
步骤4-2:使用k-means算法对矩阵U进行聚类。
作为进一步的技术方案,在步骤1中所述的多视图特征矩阵和每个视图的相似度矩阵S(v),每个特征矩阵表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111243426.6/2.html,转载请声明来源钻瓜专利网。