[发明专利]基于PSO算法的不平衡样本分类方法在审
申请号: | 201610172812.3 | 申请日: | 2016-03-23 |
公开(公告)号: | CN105868775A | 公开(公告)日: | 2016-08-17 |
发明(设计)人: | 张春慨 | 申请(专利权)人: | 深圳市颐通科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 张英;韩云涵 |
地址: | 518000 广东省深圳市罗湖区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于PSO算法的不平衡样本分类方法,通过采用粒子群优化PSO算法,对过采样过程中边界样本和安全样本的采样率进行优化得到最优过采样倍率,同时对特征进行优化,从而选择出能够达到简化运算和提升分类结果的最具代表性的特征组合。本发明采用AUC/F‑Mea作为算法的适应度函数,从而提升最终分类器的效果。 | ||
搜索关键词: | 基于 pso 算法 不平衡 样本 分类 方法 | ||
【主权项】:
一种基于PSO算法的不平衡样本分类方法,其特征在于,所述方法中PSO算法中粒子的表示为:OsRatei、UsRate和Fecj,其中OsRatei为第i个聚类簇的过采样率,i=1,2,…,N,N为通过DBSCAN算法所形成的聚类簇数目,Fecj为样本的第j个特征,j=1,2,…,M;所述方法包括:(1)将数据集划分为训练集Train和测试集Test;(2)首先在搜索空间生成初始解xi,i=1,2,…,SN,其中SN为粒子群大小;(3)令全局最优解gbest=0;(4)执行步骤(5)、(6)最大循环次数MCN次;(5)令j从1到SN,获得当前xj的解;按照得到的所述解,特征重新选择后生成新的数据集,通过k折交叉验证以及分类器学习,得到相应的AUC或者F‑Measure;(5)根据PSO算法中的速度计算公式和位置更新公式得到每个粒子的pbest,同时更新全局最优解gbest;(7)通过得到的过采样率、欠采样率和特征组合,同时进行混合采样,构建分类器进行训练数据集,然后用分类器进行训练,得到最终的AUC。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市颐通科技有限公司,未经深圳市颐通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610172812.3/,转载请声明来源钻瓜专利网。
- 上一篇:发电机组消音装置
- 下一篇:一种滤清器座和用于安装在滤清器座内的滤座阀