[发明专利]一种适用于无标签不平衡数据流的在线主动学习方法在审
申请号: | 201910001840.2 | 申请日: | 2019-01-02 |
公开(公告)号: | CN109800799A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 吴庆耀;张一帆;谭明奎 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种适用于无标签不平衡数据流的在线主动学习方法,包括:无标签数据流时序的输入线性分类器中进行预测,其中数据流的类别具有高度不平衡问题,即正类样本数量稀少;根据提出的非对称访问策略,线性分类器针对不平衡数据,动态地决定需要被标注标签的样本;根据提出的非对称更新策略,线性分类器利用错误预测的标注数据更新线性分类器,并利用样本的二阶信息提高学习效率;本发明的一种适用于无标签不平衡数据流的在线主动学习方法利用样本的二阶信息,提出了新的非对称策略;该非对称策略同时考虑样本的标注和模型的更新,能够更好地解决样本的类别不平衡问题,并提升基于流数据的主动学习模型的分类性能。 | ||
搜索关键词: | 数据流 线性分类器 主动学习 样本 非对称 标签 标注 二阶信息 时序 错误预测 访问策略 分类性能 更新策略 数据更新 学习效率 正类样本 流数据 更新 预测 | ||
【主权项】:
1.一种适用于无标签不平衡数据流的在线主动学习方法,其特征在于,包括以下步骤:步骤1、获取无标签数据流,时序地输入线性分类器中进行预测,其中数据流的类别具有高度不平衡问题,设定正类样本为类别稀少样本;步骤2、根据提出的非对称访问策略,线性分类器针对无标签不平衡数据,时序地决定需要被标注标签的样本;步骤3、根据提出的非对称更新策略,线性分类器利用错误预测的标注数据更新线性分类器,并利用样本的二阶信息提高学习效率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910001840.2/,转载请声明来源钻瓜专利网。