[发明专利]一种不同辅助样本正负比例的迁移学习方法在审
申请号: | 201811403924.0 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109598292A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 李远清;汤佳易 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助样本 目标训练 迁移 正负样本 子集 准确率 学习 交叉验证 分类准确率 多次迭代 目标测试 评价标准 随机抽取 原始分类 集合 预测 | ||
本发明公开了一种不同辅助样本正负比例的迁移学习方法,包括步骤:1)将目标训练集分为K份,采用K折交叉验证,得到原始分类准确率;2)从辅助样本集中随机抽取不同正负样本比例的辅助样本子集;3)将不同正负样本比例的辅助样本子集和目标训练集合并进行迁移学习,并采用K折交叉验证,得到迁移学习分类准确率;4)求得各类正负样本比例的辅助样本子集给目标训练集带来的准确率的提升程度;5)对于每种比例,多次迭代,求出其迁移学习平均提升程度,并以此为目标训练集选择最好的正负样本比例的辅助样本子集,从而进行迁移学习并对目标测试集进行预测。本发明为一种新的评价标准用于评价迁移学习给目标训练集带来的准确率的提升程度。
技术领域
本发明涉及机器学习的技术领域,尤其是指一种不同辅助样本正负比例的迁移学习方法。
背景技术
在传统的机器学习中,为保证训练得到的分类模型具有准确性和高可靠性,都有两个基本假设:1、训练数据和未来要处理的数据都处在相同的特征空间,并且有着相同的分布规律;2、必须有足够可利用的训练样本才能学习一个好的分类模型。但是,在现实世界的很多应用中,这个假设很可能是不成立的。比如,我们经常面临需要在一个领域内完成一项分类任务,却只在另一个领域中有足够的训练数据的情况。两者的数据可能有着不同的特征空间或者遵从不同的数据分布规律。在这种情况下,进行一次成功的知识迁移能极大的提升学习效果,从而避免大量繁重的数据标记的劳动。迁移学习运用从源领域学习的知识,对不同但相关的目标领域学习问题进行求解,解决目标领域中仅有有标签训练样本数据甚至没有的学习问题。
迁移学习又被分为归纳迁移学习(Inductive Transfer Learning),直推式迁移学习(Transductive Transfer Learning),无监督迁移学习(unsupervised transferlearning)。其中,归纳迁移学习是指目标任务与原任务不同,目标域和源域可能相同也可能不同。直推式迁移学习是指原任务和目标任务相同的,目标域和源域可能相同也可能不同。无监督迁移学习是指原任务和目标任务不相同,且目标域数据以及源域数据都没有标签。
目前,还没有一种在迁移学习的时候,通过一种评价标准来选择不同的辅助样本正负比例的方法。例如中国专利(非平衡样本分类的集成迁移学习方法,公开号CN201110452050)。该发明通过在初始化时,将目标样本的正负样本赋予不同权重,保证占比总样本比例小但信息量大的样本初始权重大,以此进行训练和分类。中国专利(一种基于迁移学习的绝对不平衡文本分类方法,公开号CN 201710675091)。该发明采用改进的Tradaboost算法,对于不同领域不同类别的样本采取不同的权重更新方式;最终分类结果由所有节点的分类器加权投票得出。以上所述发明,都没有从辅助样本的不同正负比例上考虑,不同的目标训练样本集需要的辅助样本的正负比例是不同的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种不同辅助样本正负比例的迁移学习方法,为一种新的评价标准用于评价迁移学习给目标训练集带来的准确率的提升程度,并根据迁移学习带来的准确率的提升程度为目标训练集选择最好的正负样本比例的辅助样本子集,从而进行迁移学习并对目标测试集进行预测。
为实现上述目的,本发明所提供的技术方案为:一种不同辅助样本正负比例的迁移学习方法,包括以下步骤:
1)将目标训练集分为K份,采用K折交叉验证,得到原始分类准确率;
2)从辅助样本集中随机抽取不同正负样本比例的辅助样本子集;
3)将不同正负样本比例的辅助样本子集和目标训练集合并进行迁移学习,并采用K折交叉验证,得到迁移学习分类准确率;
4)求得各类正负样本比例的辅助样本子集给目标训练集带来的准确率的提升程度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811403924.0/2.html,转载请声明来源钻瓜专利网。