[发明专利]一种利用鉴别随机邻域嵌入分析的数据降维方法无效
申请号: | 201210122457.0 | 申请日: | 2012-04-24 |
公开(公告)号: | CN102682089A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 郑建炜;邱虹;王万良;蒋一波;陈旻昊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;王利强 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 鉴别 随机 邻域 嵌入 分析 数据 方法 | ||
技术领域
本发明涉及信号处理、机器学习、模式识别和人工智能领域,尤其是一种数据降维方法。
背景技术
数据降维方法是运用计算机图形学和特征提取技术,挖掘高维数据的低维本质表达,并进行交互处理的理论、方法和技术。数据降维方法的基本原理按一般降维方法所必需的过程可划分为“数据预处理”、“映射”、“绘制显示”或“特征表达”几个步骤,即先将所采集的模拟数据和实测数据进行预处理及存储,然后利用映射模块完成将多维数据转变成本质表达的功能,接着通过绘制功能将几何数据转换成图像或者进行本质特征的后续处理。其中映射功能实质上完成的是数据建模功能,是数据降维方法的核心。因此,优秀的数据建模是数据降维方法的关键。
传统的数据降维方法,大致可归为以下5类:①用多个子窗口分别表示数据维的不同组合,如散列图矩阵(scatterplot matrices)和面向像素技术(pixel-oriented techniques);②在低维空间中对所有的数据维进行重新排列,如星型坐标系(star coordinates)和平行坐标系(parallel coordinates);③按照所有的数据维对低维空间进行层次划分,如dimensional stacking和他treemap;④采用具有多个可视特征的图标(icon),每个可视特征都可以代表一个数据维,如Chemoff-faces和stick figures;⑤将数据映射到低维空间中,尽可能保持数据间的某种关系不变,如PCA(principal component analysis),MDS(multi-dimensional,scaling),SOM(self-organizingmap),ISOMAP,LLE(locally linear embedding),SNE(stochastic neighbor embedding)、t-SNE等。相比而言,降维映射方法能更好地展现数据的本质结构,本发明提出的方法就属于这一类。
经专利查询统计,国内外已有不少数据降维方法方面的专利:例如,用于近似查询的长序列数据降维方法(200710303987.4)、一种基于规则邻域的数据降维方法(200810063304.7)、一种基于因子分析模型的高光谱数据降维方法(200910078443.1)等。
发明内容
为了克服已有降维映射方法非线性本质和无监督学习特征的不足,本发明提供一种线性有监督的、可通过类别信息提升算法的可视化性能和判别能力的利用鉴别随机邻域嵌入分析的数据降维方法。
本发明解决其技术问题所采用的技术方案是:
一种利用鉴别随机邻域嵌入分析的数据降维方法,包括以下步骤:
(1)待降维数据输入:输入数据矩阵X=[x1,x2,...,xN]及其类别标签,方差参数λ以及最大迭代次数Mt;
(2)对输入的数据进行初始化:
2.1)根据X计算输入样本间两两欧式距离;
2.2)依据原空间的样本相似度和类别标签计算联合概率pij:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210122457.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:仿生鱼型临近空间浮空飞行器
- 下一篇:冰箱及其控制方法