[发明专利]一种多维度多指标小样本数据归一化与相关性分析方法在审
申请号: | 201910207321.1 | 申请日: | 2019-03-19 |
公开(公告)号: | CN110008537A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 柯德平;徐箭;张辰;刘博;廖思阳;孙元章 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据归一化 协方差矩阵 特征向量 多维度 多指标 小样本 归一化处理 归一化数据 多组数据 分析计算 基准指标 数据设计 优化结果 正交化 最优化 度量 排序 剔除 分析 | ||
1.一种多维度多指标小样本数据归一化与相关性分析方法,其特征在于,包括:
步骤1:对多组数据进行归一化处理;
步骤2,计算协方差矩阵,并计算协方差矩阵的特征值和特征向量,将特征值按顺序排列并将各个特征值对应的特征向量进行单位正交化,采用半度量分析计算各组数据之间的相关性,剔除少量明显不相关的因素;
步骤3,使用G1法对根据各组数据之间的关系按相关程度的大小排序;定义相邻指标间的重要性程度之比;在给定基准指标重要性程度比值后,计算指标间具体的相关性数值;
步骤4,根据步骤2和步骤3计算得到的相关性数据设计最优化模型,根据优化结果计算得到综合基于归一化数据和基于指标的相关性结果。
2.根据权利要求1所述的多维度多指标小样本数据归一化与相关性分析方法,其特征在于:步骤1中所述对多组数据进行归一化处理为:
其中,Xip表示第p组样本的第i个数据,Xp,max表示第p组样本的最大值,Xp,min表示第p组样本的最小值,其中,i=1,2,…,N,p=1,2,…,P;多维指标体系中,β1,i,p指标表示第p组样本中第i个数据用线性的归一化方法处理后的数据,其仅是数据的线性处理,得到归一化后的数据;β2,i,p指标表示第p组样本中第i个数据用凸函数的归一化方法来处理后的数据,其在原来样本上用ln(x)函数进行处理,得到归一化后的数据;β3,i,p指标表示第p组样本中第i个数据用凹函数的归一化方法来处理后的数据,其在原来样本上用x2函数进行处理,得到归一化后的数据。
3.根据权利要求1所述的多维度多指标小样本数据归一化与相关性分析方法,其特征在于:步骤2中所述计算协方差矩阵为:
式中,表示第p1组指标序列的第i1个数据,表示第p2组管理指标序列的第i2个数据;
步骤2中所述计算协方差矩阵的特征值和特征向量为:
令A=Γs(i1,i2),定义协方差矩阵的特征值为λ、特征向量为φ,则
Aφ=λφ
式中,A为n×n的矩阵;φ为n×1的向量;
为求出特征值,可写为
(A-λI)φ=0
det(A-λI)=0
展开可得特征方程,λ=λ1,λ2,…,λn的n个解就是A的特征值;
求出A的特征值λ=λ1,λ2,…,λn后,利用
(A-λI)φ=0
可计算出特征值;
步骤2中所述将特征值按顺序排列并将各个特征值对应的特征向量进行单位正交化为:
接下来对特征向量φ=[φ1,φ2,…,φn]进行正交化,令
β1=φ1
接着对β=[β1,β2,…,βn]进行单位化,令
步骤2中所述采用半度量分析计算各组数据之间的相关性,剔除少量明显不相关的因素为:
对于N1组业绩指标序列数据,N2组管理指标序列数据,基于主成份的半度量分析算法过程如下式所示:
式中,ds表示距离值;为第p1组业绩指标序列样本的第i个数据,其中,i=1,2,…,N,p1=1,2,…,N1;为第p2组管理指标序列样本的第i个数据,其中,i=1,2,…,N,p2=1,2,…,N2;
v1,v2,…,vq为协方差算子特征值λ1≥λ2≥…≥λq对应的单位正交特征函数;
因为上式中存在积分形式,所以将积分项用近似的表示,可得到下式:
式中,表示第p1组业绩专业序列和第p2组管理专业序列经过计算得到的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910207321.1/1.html,转载请声明来源钻瓜专利网。