[发明专利]一种用于在线不平衡流数据的分类方法在审
申请号: | 201810732704.6 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109101993A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 胡冀;颜成钢;彭冬亮;吴建锋 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 雷仕荣 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于在线不平衡流数据的分类方法,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值;步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新。采用本发明技术方案,即解决了传统在线分类方法无解解决的不平衡流数据分类问题,同时提高了分类精度。 | ||
搜索关键词: | 在线分类 流数据 样本 敏感参数 标签 分类 标签获取 分类问题 模型获取 输入参数 样本输入 不一致 初始化 预测 更新 | ||
【主权项】:
1.一种用于在线不平衡流数据的分类方法,其特征在于,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值,其中,该模型符合高斯分布N(u,∑);步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新;其中,所述步骤S4进一步包括以下步骤:步骤S41:如果样本的标签为正,则设定代价敏感参数为C+;如果样本的标签为负,则设定代价敏感参数为C‑;步骤S42:根据代价敏感参数更新高斯分布的参数,也即,根据公式(1)求解KL距离最小的均值参量μt+1和协方差参量Σt+1作为更新值:
其中,Ccs为代价敏感参数,其值为C+或C‑;DKL(·)为KL距离的描述,N(μ,Σ)为模型的高斯分布,N(μt,Σt)为当前样本的高斯分布;
为损失函数,用于度量误分类的概率,(xt,yt)为当前样本;步骤S43:根据更新后的高斯分布更新当前权值wt+1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810732704.6/,转载请声明来源钻瓜专利网。