[发明专利]基于线性判别分析与多元自适应样条的数据分类方法在审
| 申请号: | 201910357895.7 | 申请日: | 2019-04-30 |
| 公开(公告)号: | CN110097117A | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 李智慧;王帅;刘咏梅 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于线性判别分析与多元自适应样条的数据分类方法,本发明是一种将降维与分类相结合的方法,首先通过线性判别分析方法确定最有效的分类特征,然后通过多元自适应回归样条(Multivariate adaptive regression splines,MARS)实现输入变量区间分割,将非线性分类转为线性分类问题,最后通过感知机实现分类,本发明实现了多输出分段线性分类,通过多元自适应回归样条的方式实现递归分割,通过感知机方式实现线性分类使得训练集的分类误差最小,预测时间在毫秒级以下,该算法有快速准确的特点。 | ||
| 搜索关键词: | 自适应 样条 线性判别分析 分类 数据分类 感知机 非线性分类 递归分割 分段线性 分类特征 分类问题 分类误差 区间分割 输入变量 多输出 训练集 回归 降维 算法 预测 | ||
【主权项】:
1.一种基于线性判别分析与多元自适应样条的数据分类方法,其特征在于,包括以下步骤:步骤一:对训练样本集中的待分类的M维向量xo进行线性判别分析,得到降维后的向量x,设置降维后的维数为d,具体为:步骤1:计算类内散度矩阵Sw:
其中,μj为第j类样本的均值向量,μ为所有样本的均值向量,k为类别数,Xj为第j类样本集;步骤2:计算类间散度矩阵Sb:
其中,Nj(j=1,2,…,k)为第j类样本的个数;步骤3:计算矩阵Sw‑1Sb;步骤4:通过矩阵相似对角化计算Sw‑1Sb的最大的d个特征值和对应的d个特征向量(w1,w2,…,wd),得到投影矩阵W,W=[w1,w2,…,wd],W为M行d列矩阵;步骤5:对训练样本集中的每一个样本特征xo,转化新的样本x=WTxo,x即为降成d维的向量;步骤二:把步骤一得到的x表示成多元自适应回归样条基函数Bm(x)的形式,
对于x的第m维分量xm,tkm是第k次直线分段的节点,skm∈{‑1,1},[·]+表示方括号中的向量只取大于0的部分,xkm是第k次线性分段后的xm,{m,skm,tkm}为Bm(x)的参数,具体为:步骤1:将每个x值充当节点tkm构成的基函数加入当前基函数参数集basicFunctionList中,basicFunctionList中包括待分割的x的维数dim,节点tkm,对x的basicFunctionList{i}.dim维按照节点值basicFunctionList{i}.tkm划分成两个向量,其中一个向量为大于tkm的元素置零,另一个向量为小于tkm的元素置0,将上述两个向量加入临时基函数向量集basisTmp中,根据当前基函数建立临时分类模型,计算当前模型的误差;步骤2:将误差最小值对应的基函数向量加入到基函数向量集basisSet中;步骤3:根据当前基函数集向量集basisSet建立分类模型;步骤4:如果当前误差小于误差阈值,则退出迭代;basisSet即Bm(x)是用于分类的新的向量,原x由d维变成Km维,整个B(x)的维数用KM表示,对x来说,Km个{m,skm,tkm}即线性分段模型;步骤三:得到的所有维的基函数B(x)作为分类器的输入变量建立分类模型,通过感知机方法求解分类模型,具体为:步骤1:令z=B(x),为z增加一维常数项取值为1,初始化c个KM+1维向量v为全零矩阵;步骤2:对每一类循环,在第i次循环中,选择另一个类j,按e=<vi·zi>‑<vj·zj>对所有i类样本zi计算概率差值e:在所有zi中选择e最小且为负值的样本zm,计算vi=vi+zm,vj=vj‑zm当所有<vi·zi>><vj·zj>时,或迭代次数达到限制值时,退出迭代,得到的模型是(KM+1)×c维矩阵,用V表示;步骤四:对于待分类的测试集M维向量x1,得到c维实数向量Pn,具体为:步骤1:将测试集中待分类的向量x1乘以步骤一中得到的投影矩阵W,得到新的样本x2=WTx1;取前d维形成降维后的样本x2;步骤2:根据步骤二中模型参数中{m,skm,tkm}对x2中的每一维分量xm进行分段,形成分段后的向量B(x2);步骤3:令z的第一维为全1向量,第二维以后为B(x2),得到z';步骤4:按Pn=Vz'计算出N个c维实数向量Pn;步骤5:根据每个Pn的最大值得到其类号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910357895.7/,转载请声明来源钻瓜专利网。





