[发明专利]一种基于二叉树支持向量机的分类方法有效
申请号: | 201210352700.8 | 申请日: | 2012-09-20 |
公开(公告)号: | CN102915447A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 毛清华;马宏伟;张旭辉;陈海瑜;张大伟;姜俊英 | 申请(专利权)人: | 西安科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安创知专利事务所 61213 | 代理人: | 谭文琰 |
地址: | 710054 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于二叉树支持向量机的分类方法,包括步骤:一、信号采集:采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行检测,并将所检测信号同步传送至数据处理器,相应获得与N种不同工作状态相对应的N组工作状态检测信息;二、特征提取;三、训练样本获取:分别在经特征提取后的N组工作状态检测信息中,随机抽取m个检测信号组成训练样本集;四、分类优先级别确定;五、多分类模型建立;六、多分类模型训练;七、信号实时采集及同步分类。本发明设计合理、操作简便、实现方便且使用效果好、实用价值高,不仅可以选出SVM分类器的最优参数,且能减少噪声和孤立点对分类的影响,提高了分类速度和精度。 | ||
搜索关键词: | 一种 基于 二叉 支持 向量 分类 方法 | ||
【主权项】:
1.一种基于二叉树支持向量机的分类方法,其特征在于该方法包括以下步骤:步骤一、信号采集:采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行实时检测,并将所检测信号同步传送至数据处理器(2),相应获得与N种不同工作状态相对应的N组工作状态检测信息,N组所述工作状态检测信息中均包括所述状态信息检测单元在不同采样时刻检测到的多个检测信号,其中N为正整数且N≥3;步骤二、特征提取:待数据处理器(2)接收到所述状态信息检测单元所传送的检测信号时,自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数,且该组特征参数包括W个特征量,并对W个所述特征量进行编号,W个所述特征量组成一个特征向量,其中W≥2;步骤三、训练样本获取:分别在经特征提取后的N组所述工作状态检测信息中,随机抽取m个检测信号组成训练样本集;所述训练样本集中相应包括l个训练样本,其中m≥2,l=m×N;l个所述训练样本分属于N种样本类,每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本,N种样本类分别与被检测对象的N种不同工作状态相对应的样本类1、样本类2…样本类N;N种样本类中的每一个训练样本均记作Xks,其中k为样本类的类别标号且k=1、2…N,s为各样本类中所包括m个训练样本的样本序号且s=1、2…m;Xks为样本类k中第s个训练样本的特征向量,Xks∈Rd,其中d为Xks的向量维数且d=W;步骤四、分类优先级别确定,其确定过程如下:步骤401、样本类的类中心计算:采用数据处理器(2)对N种所述样本类中任一个样本类k的类中心进行计算;且对样本类k的类中心进行计算时,根据公式
计算得出样本类k中所有训练样本的各特征量均值;式中k=1、2…N,p=1、2…d,Xks(p)为样本类k中第s个训练样本的第p个特征量,
为样本类k中所有训练样本的第p个特征量均值;步骤402、类间距离计算:采用数据处理器(2)且根据公式
对步骤201中所述任一个样本类k与N种所述样本类中任一个样本类h之间的间距分别进行计算,其中
为样本类k中所有训练样本的第p个特征量均值,
为样本类h中所有训练样本的第p个特征量均值,且h=1、2…N;步骤403、类间距之和计算:采用数据处理器(2)且根据公式
对步骤401中所述任一个样本类k的类间距之和;步骤404、多次重复步骤401至步骤403,直至计算得出N种所述样本类中所有样本类的类间距之和;步骤405、按照步骤404中计算得出的所有样本类的类间距之和由大到小的顺序,采用数据处理器(2)确定出N种所述样本类的分类优先级别Y,其中Y=1、2…N;其中,类间距之和最大的样本类的分类优先级别最高且其分类级别为1,类间距之和最大的样本类的分类优先级别最低且其分类级别为N;步骤五、多分类模型建立:所建立的多分类模型包括N-1个二分类模型,且N-1个所述二分类模型均为支持向量机模型;N-1个所述二分类模型按照步骤405中所确定的分类优先级别,将N种所述样本类自所述训练样本集中由先至后逐类分出来,N-1个所述二分类模型的建立方法均相同且均采用数据处理器(2)进行建立;对于N-1个所述二分类模型中的任一个二分类模型z来说,其建立过程如下:步骤501、核函数选取:选用径向基函数作为二分类模型z的核函数;步骤502、分类函数确定:待惩罚参数C与步骤501中所选用径向基函数的核参数γ确定后,获得二分类模型z的分类函数,完成二分类模型z的建立过程;其中,0<C≤1000,0<γ≤1000;所建立的二分类模型z为待分类优先级别高于z的所有样本类自所述训练样本集中分出来后,将分类优先级别为z的样本类自所述训练样本集中剩余的N-z+1个样本类中分出来的二分类模型,其中z=1、2…N-1;步骤503、二分类模型分类优先级别设定:根据步骤502中所述二分类模型z自所述训练样本集中剩余的N-z+1个样本类中分出来的样本类的分类优先级别z,对二分类模型z的分类优先级别R进行设定,且R=z;步骤504、多次重复步骤501至步骤503,直至获得N-1个所述二分类模型的分类函数,便完成N-1个所述二分类模型的建立过程,获得建立完成的多分类模型;步骤六、多分类模型训练:将步骤三中所述训练样本集中的l个训练样本输入到步骤五中所建立的多分类模型进行训练;步骤七、信号实时采集及同步分类:采用所述状态信息检测单元对被检测对象的当前工作状态进行实时检测,且将所检测信号同步输入至步骤五中所建立的多分类模型中,并自动输出被检测对象当前工作状态的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210352700.8/,转载请声明来源钻瓜专利网。