[发明专利]基于独立子空间虚假邻点判别的混合辅助变量的分离及降维有效
申请号: | 201310068502.3 | 申请日: | 2013-03-05 |
公开(公告)号: | CN103207945A | 公开(公告)日: | 2013-07-17 |
发明(设计)人: | 苏盈盈;刘兴华;葛继科;颜克胜;曾诚 | 申请(专利权)人: | 重庆科技学院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 401331 重庆市大学*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 独立 空间 虚假 邻点判 别的 混合 辅助 变量 分离 | ||
1.基于独立子空间虚假邻点判别的混合辅助变量的分离及降维,其特征在于按如下步骤进行:
步骤一:确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m;
将n个原始辅助变量数据写成矩阵X=[x1,…,xi,…xm]T形式,主导变量数据写成矩阵Y=[y1,…,yi,…,ym]T,其中,xi∈Rn×1,yi∈R,i=1,2,…,m,并将X,Y进行标准化处理;
步骤二:基于独立子空间虚假邻点判别的方法,主要是在独立成分分析ICA(Independent Components Analysis)的基础上,借助虚假最近邻点FNN(False Nearest Neighbors)方法,分别计算n个原始辅助变量的权重值;
步骤三:按照权重值,将n个原始辅助变量组成原始辅助变量序列;
步骤四:确定最佳辅助变量集;
步骤五:以步骤四中对应的最佳辅助变量集为自变量对系统进行最小二乘回归建模,得到混合辅助变量的分离及降维模型。
2.根据权利要求1所述的基于独立子空间虚假邻点判别的混合辅助变量的分离及降维,其特征在于步骤二中的独立子空间虚假邻点判别的辅助变量权重判别方法,包括两部分:
(一)混合辅助变量的独立成分分析ICA
第一步:输入数据X=[x1,…,xi,…xm]T,xij是一个样本,i=1,2,…,n,j=1,2,…,m;
第二步:数据中心化
第三步:由构成中心化数据矩阵计算的协方差Cx:
第四步:计算协方差Cx的特征值λi和特征向量ai:Cxai=λiai;
第五步:计算白化矩阵M:M=D-1/2VT,D为特征值λi组成的对角阵,v为特征向量ai组成的矩阵;
第六步:对中心化后的数据进行白化:
第七步:初始化分离矩阵W,W由wi构成,其中所有的wi都具有单位范数,i=1,2,…,m;
第八步:更新wi:
第九步:进行wi的正交化:
第十步:标准化wi,即:
第十一步:如果wi尚未收敛,则返回第七步,如果收敛则估计出独立分量:
(二)混合辅助变量在独立子空间的虚假最近邻点判别FNN
第一步:将需要计算权值的原始变量xi剔除,即
第二步:重复(一)中的第二步到第十一步,得到变量的新的独立信号
第三步:计算高维相空间中相点与之间的余弦测度
第四步:依次计算辅助变量x1,x2,…,xn的权重值,通过比较相应变化情况,确定输入变量对原始数据结构的影响大小,按变化由大到小的顺序进行变量选择;
第五步:余弦测度cos越大,说明剔除该变量对原始数据结构影响越小,可被剔除,余弦测度cos越小,说明剔除该变量对原始数据结构影响越大,为了保持原有数据结构变量,该变量应被保留。
3.根据权利要求1所述的基于独立子空间虚假邻点判别的混合辅助变量的分离及降维,其特征在于步骤四中确定最佳辅助变量集,按如下步骤进行:
第一步,设定循环次数N=n;
第二步,随机从样本集中选择p个样本作为训练样本,剩下的m-p个样本作为检验样本;
第三步,根据所述训练样本,利用最小二乘回归建立当前的辅助变量序列中所包含变量的非线性模型;
第四步,将所述检验样本当前的辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;
第五步,计算m-p个检验样本预测值的均方误差MSE;
第六步,删除当前原始辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列,并设定N=N-1,判断此时N是否为0:
如果N≠0,则回到第三步;
如果N=0,则最小的检验样本预测值的均方误差MSE对应原始辅助变量序列即为最佳辅助变量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆科技学院,未经重庆科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310068502.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种危险性鼾声手机采集及自救系统
- 下一篇:一种高亮度发光二极管及其制备方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用