[发明专利]采用最小最大概率机的分离概率的有监督线性降维方法在审

专利信息
申请号: 201810371801.7 申请日: 2018-04-24
公开(公告)号: CN108845974A 公开(公告)日: 2018-11-20
发明(设计)人: 宋士吉;巩延上;张玉利;黄高 申请(专利权)人: 清华大学
主分类号: G06F17/15 分类号: G06F17/15
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 廖元秋
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种采用最小最大概率机的分离概率的有监督线性降维方法,属于计算机机器学习和统计学习技术领域。该方法首先建立采用最小最大概率机的分离概率的有监督线性降维模型,模型的输入为具有多个维度和类别的样本集,输出为投影矩阵;当降维到1维时,属于单一投影向量目标;当降维到多维时,属于多个投影向量目标;本发明使用样本间的分离概率作为类别之间的距离度量,并使用了共轭梯度法进行优化,最终得到保证每一个类别对都尽量具有最大的分离概率的投影矩阵。本发明能够提高数据的可区分度以及后续分类的准确性和效率,在多类降维问题上能够达到很好的应用效果。
搜索关键词: 线性降维 最大概率 概率 降维 投影矩阵 投影向量 计算机机器学习 共轭梯度法 距离度量 统计学习 应用效果 区分度 样本集 监督 多维 维度 样本 输出 分类 优化 保证
【主权项】:
1.一种采用最小最大概率机的分离概率的有监督线性降维方法,其特征在于,该方法包括以下步骤:1)建立采用最小最大概率机的分离概率的有监督线性降维DR‑MPM模型;令模型的输入为样本集样本集中第i个个样本xi对应的类别标签记为ci,=1,2,...,n,样本集的类别总数为K,模型的输出为投影矩阵wi为构成投影矩阵的第i个投影向量;其中,n为输入的样本集中的样本序号,d为样本原始维数,p为目标维数,p<d,R表示实数集;2)对p的取值进行判定:若p=1,则为单一投影向量目标,进入步骤3);若p>1,则为多个投影向量目标,进入步骤4);3)单一投影向量目标下的降维方法;具体步骤如下:3‑1)确定单一投影向量目标下DR‑MPM模型的目标函数;当p=1时,投影矩阵W变为一个投影向量记为w;则DR‑MPM模型为一个无约束的最大化最优问题,模型的目标函数如式(1)所示:其中,式中,为第i类样本的集合,为第k类样本的集合,1≤k≤K,∑ij为第i类样本和第j类样本的类间离散度,∑i为第i类样本的类内离散度,为第k类样本的均值;3‑2)对DR‑MPM模型求解;将目标函数式(1)等价为最小化以下目标函数:式(5)所示的目标函数为一个无约束的最小化非凸问题,采用共轭梯度法对式(5)进行优化求解,具体步骤如下:3‑2‑1)设定迭代序号t=0,允许误差ε>0,将投影向量w初始化为一个随机的d×1向量w(0);3‑2‑2)计算目标函数式(5)在w(t)上的导数:其中,则共轭方向计算如下:其中,3‑2‑3)更新投影向量w;w(t+1)=w(t)+α(t)d(k)    (10)其中,α(t)由线性搜索得到,使得f(w(t)+α(t)d(t)=minαf(w(t)+αd(t));3‑2‑4)判定:若达到收敛条件,即||d(t)||<ε或‖w(t+1)‑w(t)‖<ε时,则迭代终止,得到DR‑MPM模型的最优解为w*=w(t+1),降维完毕;否则,设定t:=t+1,重新返回至步骤3‑2‑2),继续迭代;4)多个投影向量目标下的降维方法;具体步骤如下:4‑1)确定多个投影向量目标下DR‑MPM模型的目标函数;当p>1时,构成投影矩阵的每一个投影向量的目标函数与式(1)相同;对于该投影矩阵,增加约束:WTStW=I,即:其中St=Sw+Sb,且:其中,对于投影矩阵中第一个投影向量,即投影矩阵的第一列,通过重复步骤3)计算单一投影向量目标下模型的最优解进行获取,然后,利用求解得到第一个投影向量,求得下一个新的投影向量;当已经求解前r个投影向量w1,w2,...,wr之后,r<p,第r+1个投影向量wr+1存在于由矩阵的列向量线性扩张的子空间中,即:其中,Wr=(w1,w2,…,Wr)因此,存在一个向量vr,满足:wr+1=Arvr         (14)将式(14)带入到目标函数式(1)中,得到无约束优化问题如式(15)所示:其中,对式(15)求解,得到wr+1;对wr+1进行归一化:则由前r个投影向量求得了第r+1个投影向量;令Wr+1=(Wr,wr+1),继续迭代,直至得到所有p个投影向量,则最终求解得到的投影矩阵为:W*=Wp降维完毕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810371801.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top