[发明专利]采用最小最大概率机的分离概率的有监督线性降维方法在审
申请号: | 201810371801.7 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108845974A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 宋士吉;巩延上;张玉利;黄高 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线性降维 最大概率 概率 降维 投影矩阵 投影向量 计算机机器学习 共轭梯度法 距离度量 统计学习 应用效果 区分度 样本集 监督 多维 维度 样本 输出 分类 优化 保证 | ||
1.一种采用最小最大概率机的分离概率的有监督线性降维方法,其特征在于,该方法包括以下步骤:
1)建立采用最小最大概率机的分离概率的有监督线性降维DR-MPM模型;
令模型的输入为样本集样本集中第i个个样本xi对应的类别标签记为ci,=1,2,...,n,样本集的类别总数为K,模型的输出为投影矩阵wi为构成投影矩阵的第i个投影向量;其中,n为输入的样本集中的样本序号,d为样本原始维数,p为目标维数,p<d,R表示实数集;
2)对p的取值进行判定:若p=1,则为单一投影向量目标,进入步骤3);若p>1,则为多个投影向量目标,进入步骤4);
3)单一投影向量目标下的降维方法;具体步骤如下:
3-1)确定单一投影向量目标下DR-MPM模型的目标函数;
当p=1时,投影矩阵W变为一个投影向量记为w;则DR-MPM模型为一个无约束的最大化最优问题,模型的目标函数如式(1)所示:
其中,
式中,为第i类样本的集合,为第k类样本的集合,1≤k≤K,∑ij为第i类样本和第j类样本的类间离散度,∑i为第i类样本的类内离散度,为第k类样本的均值;
3-2)对DR-MPM模型求解;
将目标函数式(1)等价为最小化以下目标函数:
式(5)所示的目标函数为一个无约束的最小化非凸问题,采用共轭梯度法对式(5)进行优化求解,具体步骤如下:
3-2-1)设定迭代序号t=0,允许误差ε>0,将投影向量w初始化为一个随机的d×1向量w(0);
3-2-2)计算目标函数式(5)在w(t)上的导数:
其中,
则共轭方向计算如下:
其中,
3-2-3)更新投影向量w;
w(t+1)=w(t)+α(t)d(k) (10)
其中,α(t)由线性搜索得到,使得f(w(t)+α(t)d(t)=minαf(w(t)+αd(t));
3-2-4)判定:若达到收敛条件,即||d(t)||<ε或‖w(t+1)-w(t)‖<ε时,则迭代终止,得到DR-MPM模型的最优解为w*=w(t+1),降维完毕;否则,设定t:=t+1,重新返回至步骤3-2-2),继续迭代;
4)多个投影向量目标下的降维方法;具体步骤如下:
4-1)确定多个投影向量目标下DR-MPM模型的目标函数;
当p>1时,构成投影矩阵的每一个投影向量的目标函数与式(1)相同;对于该投影矩阵,增加约束:WTStW=I,即:
其中St=Sw+Sb,且:
其中,对于投影矩阵中第一个投影向量,即投影矩阵的第一列,通过重复步骤3)计算单一投影向量目标下模型的最优解进行获取,然后,利用求解得到第一个投影向量,求得下一个新的投影向量;当已经求解前r个投影向量w1,w2,...,wr之后,r<p,第r+1个投影向量wr+1存在于由矩阵的列向量线性扩张的子空间中,即:
其中,
Wr=(w1,w2,…,Wr)
因此,存在一个向量vr,满足:
wr+1=Arvr (14)
将式(14)带入到目标函数式(1)中,得到无约束优化问题如式(15)所示:
其中,
对式(15)求解,得到wr+1;
对wr+1进行归一化:
则由前r个投影向量求得了第r+1个投影向量;
令Wr+1=(Wr,wr+1),继续迭代,直至得到所有p个投影向量,则最终求解得到的投影矩阵为:
W*=Wp
降维完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810371801.7/1.html,转载请声明来源钻瓜专利网。