[发明专利]一种基于图正则化的鲁棒性结构非负矩阵分解聚类方法在审
申请号: | 201811597620.2 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109840545A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 舒振球;陆翼;孙燕武;范洪辉 | 申请(专利权)人: | 江苏理工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 顾翰林 |
地址: | 213001 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非负矩阵 聚类 分解 数据矩阵 特征矩阵 鲁棒性 正则化 目标函数 损失函数 迭代 鲁棒 邻近 标记数据 聚类算法 图像构造 系数矩阵 半监督 最近邻 范数 预设 重构 加权 测量 图像 引入 更新 分析 | ||
本发明提供了一种基于图正则化的鲁棒性结构非负矩阵分解聚类方法,包括:S10获取m个待聚类图像,并根据待聚类图像构造k个最邻近图;S20针对每个最邻近图得到相应的数据矩阵Y,数据矩阵Y中包括n个数据点,使用非负矩阵分解方法对数据矩阵Y进行分解得到特征矩阵W和系数矩阵H;S30基于l2,p范数建立基于图正则化的鲁棒性结构非负矩阵分解的目标函数O;S40根据目标函数O,使用迭代加权的方法迭代预设次数,对特征矩阵W、系数项及图正则项进行更新;S50采用k‑means聚类算法分别对每个最近邻图所得到的特征矩阵W进行分析并聚类。其采用鲁棒损失函数对其中的重构误差进行测量,在该鲁棒损失函数中没有使用标记数据进行判别,引入非负矩阵分解的半监督方法后,能够有效的提高效率及精确率。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于图正则化的非负矩阵分解聚类方法。
背景技术
近几年,高维数据在许多领域里出现,如多媒体分析、计算机视觉、模式识别等,如何进行降维操作成为了一个研究课题。非负矩阵分解作为一种常用的降维方法,目标是学习基于局部的特征表示,虽然其为聚类问题提供了大量的问题形成技术和算法方法,被广泛用于各种应用中。但是,这种降维方法不能保证能够得到很好的聚类性能,因此,非负矩阵变量被提出。非负矩阵分解的基本思想是学习两个最接近原始矩阵的非负矩阵,即原始数据矩阵只使用加法操作进行重构,不使用学习因子的任何减法组合,进而得到基于部分的数据表示。
在半监督学习中,同一类中由标记数据和未标记数据组成的整体往往来自同一子空间,即标记数据和未标记数据的内在表示是一致的,未标记数据的表示也具有块对角结构。在实际应用中,数据总是受到噪声和离群值的污染,极大可能会影响块对角结构的发现,降低其性能。
发明内容
针对上述问题,本发明提供了一种基于图正则化的鲁棒性结构非负矩阵分解聚类方法,有效解决现有技术中数据受到噪声和离群值的污染后,可能会影响块对角结构的发现并降低其性能的技术问题。
本发明提供的技术方案如下:
一种基于图正则化的鲁棒性结构非负矩阵分解聚类方法,包括:
S10获取m个待聚类图像,并根据待聚类图像构造k个最邻近图;
S20针对每个最邻近图得到相应的数据矩阵Y,所述数据矩阵Y中包括n个数据点,使用非负矩阵分解方法对数据矩阵Y进行分解得到特征矩阵W和系数矩阵H;
S30基于范数建立基于图正则化的鲁棒性结构非负矩阵分解的目标函数O;
其中,表示正则化项,μ表示基础系数,Z表示正则化项中的指标矩阵,表示标记数据点矩阵,表示无标记数据点的零矩阵;表示系数项,β表示稀疏系数;λTr(WTLWW)和μTr(HTLHH)表示图正则项,λ表示低秩系数,LW=EW-VW和LH=EH-VH为拉普拉斯方程,V为构造的最近邻图的权重矩阵,E为对角矩阵;
S40根据目标函数O,使用迭代加权的方法迭代预设次数,对特征矩阵W、系数项及图正则项λTr(WTLWW)和μTr(HTLHH)进行更新;
S50采用k-means聚类算法分别对每个最近邻图所得到的特征矩阵W进行分析并聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏理工学院,未经江苏理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811597620.2/2.html,转载请声明来源钻瓜专利网。