[发明专利]一种基于二叉树支持向量机的分类方法有效
申请号: | 201210352700.8 | 申请日: | 2012-09-20 |
公开(公告)号: | CN102915447A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 毛清华;马宏伟;张旭辉;陈海瑜;张大伟;姜俊英 | 申请(专利权)人: | 西安科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安创知专利事务所 61213 | 代理人: | 谭文琰 |
地址: | 710054 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二叉 支持 向量 分类 方法 | ||
技术领域
本发明属于缺陷识别技术领域,尤其是涉及一种基于二叉树支持向量机的分类方法。
背景技术
缺陷的智能识别是在缺陷特征提取的基础上,确定识别算法,设计出相应的分类器,并用样本集合进行训练,最后完成对缺陷的自动分类。目前主要有统计分类方法、基于规则的分类方法和基于学习的分类方法。常见的分类器有决策树分类、贝叶斯分类、模糊分类法、人工神经网络分类法和支持向量机分类法等,在数据信号处理方面应用较多的是后两种。其中,人工神经网络分类法由于人工神经网络没有专门的训练和学习函数来确定网络结构,且需要大量训练样本,因而实际应用中条件往往难以满足。
支持向量机(Support Vector Machine,SVM)是上世纪九十年代一种新的模式识别方法,其通过非线性变换将输入空间映射到高维空间,在新空间中求得最优分类超平面。由于实际样本中,可能存在孤立点或者噪声,它对常用的C-SVM或者v-SVM的最优分类超平面影响较大。针对该问题,有些学者提出了模糊支持向量机FSVM(Fuzzy Support Vector Machine FSVM)。孙波等人提出一种计算样本隶属度的新方法,降低噪声点的隶属度,提高了支持向量对最优分类面的贡献。陈小娟等人针对分类问题的支持向量机方法中存在对噪声和野值敏感的问题,提出了一种新的隶属度函数确定方法。徐鲁强等人提出了一种符合高斯形式的构建模糊隶属度函数方法,减弱了野点样本对分类的影响,提高了情感状态识别效果。Qi Xu等人应用模糊支持向量机对带有噪声和孤立点的脑电图信号进行分类,结果表明FSVM分类性能减少了噪声和孤立点对分类的影响。
SVM本身是一个两分类方法,如何将其推广到多分类,以适应实际中缺陷或故障快速、准确识别,是一个迫切需要解决的问题。目前,多类SVM成为多类模式识别研究与应用的热点。现在已有的多类SVM分类方法大致可分为两种:直接求解算法和分解重构算法。直接求解法是在所有训练样本上求解一个大型二次规划问题,同时将所有类别分开。该方法变量个数多,计算复杂度很高,尤其当类别数目较多时,它的训练速度很低,分类精度也不高;分解重构法是一种将多类分类问题转化为多个两类分类问题,并采用某种策略将多个两类分类器组合起来实现多类分类的方法。分解重构法比直接求解法更适合于实际应用,用它实现多类分类需要解决两个关键问题:模糊类的生成和多个两类分类器的组合策略。当前应用较广泛的SVM分解重构算法有1-a-r(one-against-rest)方法,1-a-1(one-against-one)方法、DAGSVM(Directed Acyclic Graph Support Vector Machines)方法,DTSVM(Decision Tree Support Vector Machines)方法以及HSVM方法(Hierarchical Support Vector Machines)等。这些方法在多分类中各有优缺点,研究表明:1-a-r分类方法简单、有效,可用于大规模数据,但当工作集过大时,训练速度将会很慢;同时它存在误分、拒分区域,泛化能力较差。1-a-1分类速度,比传统的1-a-r方法快,而且其分类精度也较1-a-r高;但其缺点是:如果单个两类分类器不规范,则整个分类器将趋向于过学习,分类器的数目随类数急剧增加,导致在决策时速度很慢,存在推广误差无界及误分、拒分区域。DAGSVM方法较1-a-1方法提高了测试速度,而且不存在拒分区域;另外,由于其特殊的结构,故有一定的容错性,分类精度较一般的二叉树方法高,但该方法的泛化能力与各子分类器在有向无环图中的位置有关。DTSVM和HSVM采用树结构的组合策略,具有较高的训练和分类速度,但分类树存在错分积累,如果选择合理的树结构可以获得较高的分类速度和精度。通过以上多分类方法特点比较,二叉树SVM综合性能较好,关键是要选择合理的二叉树结构。
综合分析神经网络和支持向量机在缺陷多分类方面的优缺点,为了有效提高缺陷或故障分类的可靠性、实时性,必须对现有的分类方法进行改进。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于二叉树支持向量机的分类方法,其设计合理、操作简便、实现方便且使用效果好、实用价值高,不仅可以选出SVM分类器的最优参数,且能减少噪声和孤立点对分类的影响,提高了分类速度和精度。
为解决上述技术问题,本发明采用的技术方案是:一种基于二叉树支持向量机的分类方法,其特征在于该方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210352700.8/2.html,转载请声明来源钻瓜专利网。