[发明专利]一种提高二分类支持向量机分类精度的方法无效
申请号: | 201210544669.8 | 申请日: | 2012-12-13 |
公开(公告)号: | CN103065154A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 刘世元;朱金龙;张传维;陈修国 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种提高二分类支持向量机分类精度的方法,步骤为:在待分类的样本空间中获取训练样本,得到2p个具有n个维度训练样本;利用训练样本集进行支持向量机训练,获取分类边界权系数向量w;利用支持向量机对所有训练样本进行映射,统计出所有被错误识别的训练样本集I1;按绝对值的大小对向量w中的每一个分量进行排序;找出排序最后的分量并剔除;重复m次,训练样本的维度减少到n-m;剔除掉这些错误训练样本;对剩余的训练样本进行支持向量机训练,该支持向量机即为最优支持向量机。本发明可以筛选出训练样本中的最优维度,剔除训练样本集中的劣质训练样本,进而从源头上保证并提高了分类精度。 | ||
搜索关键词: | 一种 提高 分类 支持 向量 精度 方法 | ||
【主权项】:
一种提高二分类支持向量机分类精度的方法,该方法包括下述步骤:第1步在待分类的样本空间中获取训练样本,每一类样本空间对应一个训练样本集合,每一个训练样本集合中的每一个样本描述为向量形式,设向量的长度为n,即训练样本具有n个维度;每一个训练样本集合具有p个训练样本,两个训练样本集合则有2p个训练样本;第2步利用训练样本集进行支持向量机训练,当支持向量机训练完毕,获取分类边界权系数向量w,其中w=[ω1,ω2,...,ωn],为一个维度为n的向量,其每一个向量分量对应于训练样本的一个维度上的数据;第3步利用第2步中训练得到的支持向量机对训练样本集中的所有训练样本进行映射,根据映射结果统计出所有被错误识别的训练样本,这些被错误识别的训练样本组成一个错误样本集,该错误样本集被标记为I1;第4步按照向量w中的每一个分量的绝对值的大小对向量w中的每一个分量进行排序,向量分量的绝对值越大,其重要性越高;第5步找出向量w中重要性最小的的分量,剔除掉该最小分量对应的所有训练样本数据中那个维度上的数据,从而使所有训练样本的维度均减少到n‑1;第6步利用第4步中得到的维度为n‑1的所有训练样本进行支持向量机训练,即重复第2步至第5步的过程,重复预先设定m次,即得到m个错误样本集,训练样本的维度减少到n‑m;第7步找出m个错误样本集中共同的错误训练样本,并从第6步中获得的所有n‑m维训练样本中剔除掉这些错误训练样本;对剩余的训练样本进行支持向量机训练,该支持向量机即为最优支持向量机。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210544669.8/,转载请声明来源钻瓜专利网。