[发明专利]一种基于稀疏感知的局部线性嵌入算法在审
| 申请号: | 202210084171.1 | 申请日: | 2022-01-19 |
| 公开(公告)号: | CN114492626A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 袁玉波;宋湘 | 申请(专利权)人: | 华东理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200237 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 稀疏 感知 局部 线性 嵌入 算法 | ||
现实世界的数据往往是混含有噪声和缺失值的,不同于以往数据降维过程,噪声和缺失值在数据清洗阶段进行处理,本章着眼于保留数据原有特征的前提下,对机器学习的特征降维问题提出了一种新的解决视角。本章基于低秩表达算法和LLE的算法模型,提出了基于稀疏感知的局部线性嵌入算法LLE‑SS。该方法为了既保持原数据流形结构又学习到数据降躁的近邻特征,将原数据经过低秩处理得到的数据作为LLE算法的近邻选择的输入,再将新数据的近邻特征结合原数据进行局部的线性嵌入。在实验部分,本章选取了7个常用的图像数据库作为实验对象,给出了常见特征抽取算法对比LLE‑SS方法的实验结果。实验结果表明,在噪声干扰的情况下,LLE‑SS在学习多流形结构数据的和单流形结构数据上相比较LLE方法具有更佳的可视化效果以及误差收敛性能。
技术领域
本发明主要涉及数据降维处理技术,具体涉及一种基于流形学习的局部线性嵌入算法。
背景技术
随着云计算与大数据技术的发展,各行各业纷纷加入数字化转型,产出的数据形式复杂多样,数据维度呈爆发式增长。为了加快模式识别过程收敛速度,避免维度灾难,降维成为模式识别过程中必不可少的一步。然而真实的数据关系大多呈非线性结构,传统的线性降维方法主成分分析PCA难以挖掘出复杂结构信息。作为非线性流形学习领域的经典算法,局部线性嵌入算法LLE以在嵌入空间中尽可能的保留潜在的近邻流形结构信息为目标,是第一个聚焦于局部视角的经典流行学习方法。目前LLE在众多领域已具有较好的实践,例如图像分类、植物叶片识别、机械故障检测以及步态识别等复杂工业应用。
但LLE以及基于LLE的研究成果其算法效果受原始数据集质量的牵制,具有稀疏表现的缺失数据集会导致近邻选择失真以及线性系数度量有误。为了解决LLE以上问题,目前大部分的研究方向以添加正则化项和核技术应用为主。2008年,研究人员提出基于核方法的局部线性嵌入,用于数据集中的异常值检测。2014年,研究人员提出一种真实局部线性保持嵌入方法,防止噪声干预局部空间选择后,进一步影响系数矩阵的计算,在权重矩阵目标式上加上l2正则项。2015年研究人员等人结合l1正则化既能降低噪声干预又能体现特征重要度的特点,提出一种基于l1正则化的LLE并运用于机器故障数据。
发明内容
本发明目的在于提出一种基于稀疏感知的局部线性嵌入,以为了应对由于数据部分缺失而导致局部线性嵌入算法失效的情况。假设数据集包含N个D维的真实样本xi,i∈(0,N),采样于d(d<<D)维光滑流形结构,组成数据集X=[x1,...,xN]∈RD×N。集合Y=[y1,...,yN]∈ Rd×N表示集合X在d维空间中的映射结果。
本发明的技术方案如下:
步骤S1,数据预处理。对输入的样本数为N,维度为D的原始数据进行预处理。采用归一化方法,将数据范围规范为0至1区间内,得到规范矩阵X=[x1,...,xN]∈RD×N
步骤S2,稀疏样本低秩表示。运用TRNN矩阵补全算法方法对缺失数据进行填充去躁。利用公式得到数据补全后的数据集X′。
步骤S3,邻域空间选择。通过近邻选择算法对X′中的每个样本选择出k个近邻样本,构造出X′的邻接矩阵Θ。利用公式计算得到矩阵Θ,矩阵每行代表每个样本同其他样本是否近邻关系。
其中∈k(x′i)表示以样本x′i为中心的k邻域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210084171.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:晶圆背面减薄方法
- 下一篇:一种电机的风叶组装和性能检测一体化设备





