[发明专利]一种多维度多指标小样本数据归一化与相关性分析方法在审
申请号: | 201910207321.1 | 申请日: | 2019-03-19 |
公开(公告)号: | CN110008537A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 柯德平;徐箭;张辰;刘博;廖思阳;孙元章 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据归一化 协方差矩阵 特征向量 多维度 多指标 小样本 归一化处理 归一化数据 多组数据 分析计算 基准指标 数据设计 优化结果 正交化 最优化 度量 排序 剔除 分析 | ||
本发明提出了一种多维度多指标小样本数据归一化与相关性分析方法。对多组数据进行归一化处理;计算协方差矩阵,并计算协方差矩阵的特征值和特征向量,将特征值按顺序排列并将各个特征值对应的特征向量进行单位正交化,采用半度量分析计算各组数据之间的相关性,剔除少量明显不相关的因素;使用G1法对根据各组数据之间的关系按相关程度的大小排序;定义相邻指标间的重要性程度之比;在给定基准指标重要性程度比值后,计算指标间具体的相关性数值;根据相关性数据设计最优化模型,根据优化结果计算得到综合基于归一化数据和基于指标的相关性结果。本发明分析结果更加可靠、精准。
技术领域
本发明属于电力系统技术领域,尤其是涉及一种多维度多指标小样本数据归一化与相关性分析方法。
背景技术
归一化,也称作数据的标准化、规格化、无量纲化,是一种通过数学变换来消除原始数据差异性的影响方法。在统计学中的多指标综合评价中会涉及到两个基本变量:一是各评价指标的实际值,另一个是各指标的评价值。一方面,由于各指标所代表的物理涵义不同,因此存在着量纲上的差异,这种量纲性差异是影响对事物整体评价的主要因素;另一方面,各指标数值上也存在不同的数量级的差异,即量级上的差异,需要把不同指标在同一基础和数量级上进行比较。为此,本发明提出一种多指标的归一化手段来消除数据量级的影响。
在综合评价中,不同的归一化方法,将得到不同的单项评价值,它反映了评价者对单个评价指标中所包含的评价信息量及指标原值变动与评价信息量之间函数关系形式的认识发生了变化。目前,已有的去量纲去量级的归一化方法很多,本发明主要根据数据的特性一种多维度多指标小样本数据归一化方法。小样本分析在统计学中的分布特性,参数估计,假设检验方面都具有一定程度的局限性,而在统计学中相关性分析对数据的准确度和数量要求高,所以对于小样本的相关性分析偶然性强,要求原始数据真实可靠。根据小样本数据突出的数学特性,利用本发明对小样本数据进行归一化和相关性分析。然而,目前存在的问题是对同一个评价对象,各种归一化方法得出的结论往往不一致,这就给具体的分析评价工作带来了很大的困难。因而,在实际的归一化方法选择的工作中,应注意到指标归一化方法对Xi序列排序的可靠性影响问题:即在同一数据模型的情况下,采用不同的归一化方法,其Xi的排序是不同的,所以需要实际情况对归一化方法的优化选择是非常具有实际意义的研究工作。
在统计学中一般使用相关系数来判断一个变量同另一个变量线性相关的程度。一般来说,相关系数的绝对值接近于1,就说明因变量与自变量之间的联系紧密,而越接近于零则说明因变量与自变量之间的联系松散。根据相关系数进行分析时,首先要求样本的数量足以充分的反映各个变量的基本性质。
发明内容
本发明主要是解决现有技术所存在的技术问题;提供了一种多维度多指标小样本数据归一化与相关性分析方法,通过归一化方法把两类数据归一化到同一区间内,消除量级上的差距,为相关性分析提供准备合理的数据。这里为了处理方便,选取归一化后的数据区间为[0,1]。
本发明目的是解决现有技术所存在的技术问题;在本发明的归一化方法中,目的不仅仅是为了基于不同指标在同一基础水平上的归一化方法,而是要再寻找一种归一化方法使得数据和已经处理后的数据在0到1区间。因而,需要考虑结合数据分布特性和数据区间特性,从而形成一种多维度的归一化方法。
本发明的相关性分析方法中,根据多维度多指标归一化的结果,可以看出相关性分析的输入数据为一个序列组,根据数据突出的数学特性,利用本发明方法对归一化后的数据进行相关性分析。
本发明的相关性分析方法中,根据基于归一化数据的相关性算法的结果,已经可以初步得出各组数据之间的相关性强弱。但是由于计算的输入数据比较粗糙,在某些方面计算结果不够精细。有必要根据其他数据来源进行进一步的相关性分析,使得最终的相关性分析结果更加可靠、合理、准确。根据指标责任分解表,进一步从这一层面分析各组数据之间的相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910207321.1/2.html,转载请声明来源钻瓜专利网。