[发明专利]一种基于权值局部切空间排列改进算法的数据降维方法在审

专利信息
申请号: 201711058169.2 申请日: 2017-11-01
公开(公告)号: CN107748791A 公开(公告)日: 2018-03-02
发明(设计)人: 董渭清;郭桑;李玥;陈建友;董文鑫;袁泉;仓剑 申请(专利权)人: 西安交通大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 西安通大专利代理有限责任公司61200 代理人: 徐文权
地址: 710049 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 局部 空间 排列 改进 算法 数据 方法
【说明书】:

技术领域

发明属于大数据处理领域,涉及一种数据降维方法,具体涉及一种基于权值局部切空间排列改进算法的数据降维方法。

背景技术

大数据时代下,数据挖掘的主要目的是利用高效算法来探索隐藏在数据背后的信息,并最终转化为知识来引导人们做出合理决策。数据降维是将数据从高维特征空间投影到低维特征空间的过程,且在降维的过程中能极大的保留数据的本质结构。降低数据的维度,可以更有利于数据挖掘,且通过数据降维,将高维数据进行低维表示,需要保持其本质结构和信息,同时剔除到数据中的冗余信息、错误信息、缺失信息。从数据的特性出发,降维方法又有线性降维和非线性降维两种方法。为了有效的探索数据集中所含的非线性结构,人们发展了许多有效的非线性降维手段,比如基于局部切空间排列算法的流形学习,使用非线性变换把高维流形数据投影到低维流形空间(假设这些数据采样均匀)。但是采样密度的大小以及采样方式的不同,都会导致降维结果的波动很大。目前的方法中在处理曲率较大和稀疏或分布不均匀的流形数据时,存在降维处理效果差的缺陷。

发明内容

为了解决现有技术中的问题,本发明提出了一种基于权值局部切空间排列改进算法的数据降维方法(简称IWLTSA),依据局部的线性嵌入,考虑了不均匀的数据对降维效果的影响,将每一个样本点本身用来逼近切空间,替换了其本身邻近点的均值,克服了现有方法在处理曲率较大和稀疏或分布不均匀的数据时降维效果差的缺陷。

为了实现以上目的,本发明所采用的技术方案为:

一种基于权值局部切空间排列改进算法的数据降维方法,包括以下步骤:

1)选取数据采样点的邻近点,将邻近点的最小化投射距离的加权和问题转化为最大化矩阵问题,建立目标函数;

2)求解目标函数,得到每个邻域中降维后的局部切坐标;

3)把每个邻域中计算的局部切坐标排列重构到全局坐标,完成数据降维。

进一步的,所述步骤1)中选取邻近点的时候,将每一个给定的数据采样点本身xi来逼近切空间,替换数据采样点本身的邻域数据样本点的加权均值,样本点本身作为切空间的原始点,构成的目标函数为:

其中,xi表示采样点;表示采样点xi的第j个邻近点;wij表示采样点xi的第j个邻近点的权重向量,j=1,2,...,k;Qi表示采样点xi对应的特征向量;QiT表示Qi的转置。

进一步的,所述目标函数中Qi是切空间Ty上的一组正交基底,则有QiTQi=In,目标函数简化为:

由于为固定值,则邻近点的最小化投射距离的加权和问题转化为最大化矩阵问题,此时目标函数转化为求解满足下式的Qi

进一步的,所述步骤2)中令Wi(j,j)=wij表示点xi的第j个邻近点的权重值,令则目标函数进一步简化为:

则此时目标函数转化成求解满足下式的Qi

求解上述方程,得到为矩阵的最大的k个特征值所对应的特征向量,则根据下式得到降维后的局部切坐标

进一步的,所述步骤3)中计算所有采样点{x1,...,xN}的每个邻域中降维后的局部切坐标,得到每个采样点的每个邻域中降维后的局部切坐标集合:

将每个邻域中计算的局部切坐标排列重构到全局坐标,当是xi的邻域时,假设Y=[yi,…,yN]是X的一组降维后的切空间上的全局坐标,并假设是的全局坐标,低维空间的维度为d,在重构全局坐标时,直接用样本点x1作为切空间的原点,则此时切空间重构误差函数转化为:

其中,yi为xi降维后的点,Li表示局部排列转换矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711058169.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top