[发明专利]一种基于正则化Fisher阈值选择策略的不平衡数据分类系统在审
申请号: | 201810142731.8 | 申请日: | 2018-02-11 |
公开(公告)号: | CN108416373A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 王喆;李冬冬;朱昱锦;高大启 | 申请(专利权)人: | 华东理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于正则化Fisher阈值选择策略的不平衡数据分类系统,首先将采集的样本转为适于后续处理的向量;在训练阶段,先实现正则化Fisher线性判别模型,在训练集上优化并输出相关参数,然后自定义的八个阈值训练八个新的正则化Fisher模型并通过验证选出最佳模型作为代表;接着根据训练第一步生成的原始超平面生成新超平面并根据新超平面筛选出候选样本及各类的距离向量。验证集上比较代表两种策略的两个改进正则化Fisher模型,输出较好的一个等待测试。相较于传统的分类技术,本发明使用正则化方法使得原始的Fisher线性判别模型能更好学习到数据全局分布信息;通过两种不同策略的选择,使得原本受到不平衡样本误导的阈值得到修正,并大大缩短调试时间。 | ||
搜索关键词: | 正则化 超平面 数据分类系统 阈值选择 样本 分布信息 分类技术 候选样本 后续处理 距离向量 输出相关 训练阶段 最佳模型 阈值训练 传统的 训练集 验证集 自定义 向量 调试 验证 采集 测试 筛选 修正 输出 全局 优化 改进 学习 | ||
【主权项】:
1.一种基于正则化Fisher阈值选择策略的不平衡数据分类系统,其特征在于:具体步骤是:1)预处理:将采集的样本转为适于后续处理的向量;2)训练首步:实现正则化Fisher线性判别模型,在训练集上优化并输出相关参数;3)训练次步:开启阈值选择策略,执行策略一,根据自定义的八个阈值训练八个新的正则化Fisher模型并通过验证选出最佳模型作为代表;4)训练三步:开启阈值选择策略,执行策略二,根据训练第一步生成的原始超平面生成新超平面并根据新超平面筛选出候选样本及各类的距离向量;5)验证步骤:在验证集上比较代表两种策略的两个改进正则化Fisher模型,输出较好的一个等待测试,另一个则保留;6)测试步骤:根据验证步骤结果选择模型预测数据,当优先级高的模型失效时使用剩下的模型进行预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810142731.8/,转载请声明来源钻瓜专利网。