[发明专利]一种考虑全局-局部结构的含噪高维数据降维方法在审
申请号: | 202011457930.1 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112528222A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 尹宏鹏;周瀚;关彦威;李艳霞 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 全局 局部 结构 含噪高维 数据 方法 | ||
本发明涉及一种考虑全局‑局部结构的含噪高维数据降维方法,属于计算机领域。该方法包含以下步骤:步骤一:数据预处理;步骤二:构建鲁棒非负矩阵分解模型Ω(U,V);步骤三:构建全局约束正则项Ωg(I,U);步骤四:构建局部约束正则项Ωl(W,V);步骤五:综合步骤二、三、四的模型与正则项,形成总模型Ω(U,V)+αΩg(I,U)+βΩl(W,V);步骤六:应用KKT条件,得到模型的迭代求解公式;步骤七:输出高维数据在低维空间的特征。利用构建模型,提升模型对离群点与噪声的鲁棒性。
技术领域
本发明属于计算机领域,涉及一种考虑全局-局部结构的含噪高维数据降维方法。
背景技术
随着信息技术的发展,高维数据在各领域大量涌现,高维数据挖掘已成为数据挖掘的重点。受到“维数灾难”的影响,高维数据挖掘变得异常地困难。数据降维是解决该问题的有效思路,常见的数据降维方法包括主成分分析(PCA),奇异值分解(SVD),矢量量化(VQ),非负矩阵分解(NMF)等。NMF在降维过程中加入了非负约束,使得高维数据在低维空间中变为各基向量的纯加性组合。这一特性符合人脑感知中“整体由局部组成”的生理与心理要素,因此NMF在人脸识别、文本分析等领域中具有优势。
近年来,一些学者也在NMF中介入一些额外约束以提升算法的可靠性。Kong等人提出鲁棒NMF模型(RNMF),他们利用范数构造NMF的目标函数,使该模型对离群点与噪声更具有鲁棒性。Ding等人提出一种正交非负矩阵三分解模型(ONMTF)。他们通过在基矩阵与系数矩阵引入正交约束,使得不同类型的数据在全局上更具有鉴别性。Cai等人提出一种图约束的NMF模型(GNMF),通过利用最近邻图编码数据的几何结构,使得低维数据保留了高维数据的局部结构。
高维数据的结构可以分为全局结构与局部结构。全局结构主要反映数据外部整体的特征而局部结构主要描述数据内在的组织方式,两者都包含重要信息。而现在的非负矩阵分解方法往往只针对一种数据结构进行考虑,因此降维得到的高维数据特征难以完整、准确的描述原始数据,造成信息的丢失和误读。
发明内容
有鉴于此,本发明的目的在于提供一种考虑全局-局部结构的含噪高维数据降维方法。
为达到上述目的,本发明提供如下技术方案:
一种考虑全局-局部结构的含噪高维数据降维方法,包含以下步骤:
步骤一:数据预处理;获取N个具有d维的故障样本,并构建原始样本数据矩阵其中每一列代表一个样本;并将样本的原始数据线性映射到[0,1]之间得到X;
步骤二:构建鲁棒非负矩阵分解模型Ω(U,V);
步骤三:构建全局约束正则项Ωg(I,U);
步骤四:构建局部约束正则项Ωl(W,V);
步骤五:综合步骤二、三、四的模型与正则项,形成总模型Ω(U,V)+αΩg(I,U)+βΩl(W,V);
步骤六:应用KKT条件,得到模型的迭代求解公式;
步骤七:输出高维数据在低维空间的特征。
可选的,所述步骤2具体为:
S2.1构建l2,p范数约束的非负矩阵分解模型:
其中||·||2,p代表l2,p范数;U为基矩阵V为系数矩阵为降维后空间维数k=m×C<d,C为数据类别数,m为自定义整数。
可选的,所述步骤3具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011457930.1/2.html,转载请声明来源钻瓜专利网。