[发明专利]一种基于AdaBoost的半监督学习标签噪声防御算法在审
申请号: | 202110587195.4 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113269258A | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 张宏坡;程宁;张洋;张博 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;H04L12/58 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 针对数据中存在的标签噪声问题,本发明提出一种标签校正框架来检测数据中存在的标签噪声。基于五个真实的UCI数据集和TREC 2007垃圾邮件数据集,本发明技术方案首先人为地向数据集中注入标签噪声;然后利用标签噪声检测框架来标记可疑的样本标签并重新标注噪声样本的标签;最后使用机器学习算法评估了该检测框架的有效性。本发明的关键技术是一种基于AdaBoost的半监督学习标签噪声防御算法(AdaSSL)。该AdaSSL算法首先使用AdaBoost算法将数据集划分为权重较大的样本集和权重较小的样本集;然后使用半监督学习算法重新标记权重较大的样本集合的标签;最后汇总两个集合的样本。AdaSSL防御算法结合了AdaBoost和半监督学习技术的优点,有效地改善了数据集中样本的标签质量,提高了机器学习分类性能。 | ||
搜索关键词: | 一种 基于 adaboost 监督 学习 标签 噪声 防御 算法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110587195.4/,转载请声明来源钻瓜专利网。