[发明专利]一种基于维度相关性分析的高维数据维度排序方法在审
申请号: | 201610185969.X | 申请日: | 2016-03-29 |
公开(公告)号: | CN105868352A | 公开(公告)日: | 2016-08-17 |
发明(设计)人: | 刘腾;张怡;李克非 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于维度相关性分析的高维数据维度排序方法,包括:进行维度聚类;计算维度间类和类的对应概率来判断两个维度成强相关还是弱相关,若是两个类之间对应概率较大,则成强相关,反之则成弱相关,然后统计两个维度所有类的对应概率和作为判断两个维度相关性的标准;维度排序。本发明的维度相关性的分析方法是基于聚类的,通过分析类与类之间的对应关系来判断其所属维度的相关性,比起直接计算数据点之间的对应关系要简便很多,很大程度上减少了计算量,而且最终的相关性用数值来表示,可以很直观的看出两个维度的相关性大小。 | ||
搜索关键词: | 一种 基于 维度 相关性 分析 数据 排序 方法 | ||
【主权项】:
一种基于维度相关性分析的高维数据维度排序方法,包括下列步骤:(1)进行维度聚类使用K‑means算法对高维数据集D={d1,d2,d3,...,dm}的每一维度分别聚类;(2)维度相关性分析根据上述的聚类结果,计算维度间类和类的对应概率来判断两个维度成强相关还是弱相关,若是两个类之间对应概率较大,则成强相关,反之则成弱相关,然后统计两个维度所有类的对应概率和作为判断两个维度相关性的标准,步骤如下:①计算类之间的对应概率对于高维数据集D={d1,d2,d3,...,dm}的任意两个维度di和dj,设维度di被聚成n类,维度dj被聚成m类,计算类之间的对应概率,令di,p为维度di的p类,dj,q为维度dj的q类,统计落在di,p中的数据个数num(i,p)和落在dj,q中的数据个数num(j,q),然后统计共同落在这两个类中的数据个数num,得到这两个类di,p和dj,q的对应概率定义为:![]()
②维度间的相关性分析计算两个维度间所有类的对应概率和作为两个维度相关性判断的标准,进行维度间的相关性分析;(3)维度排序在维度相关性分析的基础上,将维度按照相关性大小进行排序,使得相邻之间的维度有较强的相关性,方法为:首先选择一个维度放在序列的第一个位置,然后找与其最相关的维度放在其后,以此类推,直到所有的维度排列完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610185969.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种大规模多媒体数据的空间索引方法
- 下一篇:一种电动自行鞋容腔机构