[发明专利]一种迁移学习分类的方法及装置在审
申请号: | 201710547008.3 | 申请日: | 2017-07-06 |
公开(公告)号: | CN107341512A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 李子彬;刘波;肖燕珊 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 迁移 学习 分类 方法 装置 | ||
技术领域
本发明涉及分类学习领域,更具体地说,涉及一种基于聚类的dynmaic-TrAdaboost迁移学习分类的方法及装置。
背景技术
分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型,即我们通常所说的分类器(Classifier)。在传统的分类学习中,主要通过对带标签数据组成的数据集进行训练,得到分类模型,但是实际上,对于带标签的数据进行收集的工作十分困难,需要耗费大量的精力和资源。迁移学习则可以通过对源数据集进行处理从而使其向目标数据集进行迁移,迁移后就可以得到需要的数据集,从而解决带标签数据缺乏的问题。
现有迁移学习中,主要思想时通过基于boosting算法,自动迭代增大有利的辅助数据集的权重,减少有利性较差的辅助数据集的权重,并将这些带有权重的数据用于目标数据集的分类,在每次迭代后得到相关域中的分类器。然而随着迭代的进行,由于迭代中的一些误差干扰,造成在源域中的权重只会下降,目标域中的权重只会上升,因此,目标域与源域中就会出现两极分化的现象,使源域在过程中权重下降过快,并且分类器容易过度集中在难以分类的样本上,而不能集中在容易分类的样本上。
因此,如何避免权重更新两极分化的问题,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种基于聚类的dynmaic-TrAdaboost迁移学习分类的方法及装置,以避免权重更新两极分化的问题。
为实现上述目的,本发明实施例提供了如下技术方案:
一种基于聚类的dynmaic-TrAdaboost迁移学习分类的方法,包括:
S101,利用总数据集得到总数据集的总权重集,并设置第一权重值跟踪指数,其中所述总数据集为源数据集的带权重数据与目标数据集的带权重数据的组合;
S102,在总数据集中调用基分类器,并利用总权重集得到候选的弱分类器;
S103,判断所述弱分类器是否满足预设目标分类器条件,若是,则利用所述弱分类器计算得到目标分类器,利用所述目标分类器对未分类数据进行分类,若否,则继续执行S104;
S104,计算所述弱分类器在目标数据集上的误差,并利用所述误差计算得到动态因子;
S105,设置第二权重值跟踪指数;
S106,利用所述第一权重值跟踪指数、所述第二权重值跟踪指数与所述动态因子,更新总权重集;
S107,将更新后的总权重集中的每一个权重与预设阈值进行比较,从更新后的总权重集中删除小于所述预设阈值的目标权重值,从总数据集中删除与所述目标权重值对应的数据,得到更新后的总数据集与更新后的总权重集,返回S102。
其中,在所述S101之前,还包括:
对原始训练集进行筛选,得到总数据集。
其中,所述对原始训练集进行筛选,得到总数据集,包括:
获取原始训练集,其中所述原始训练集包括原始源数据集与原始目标数据集;
将所述原始训练集划分为多个子集,并删除每个子集中不在一个簇内的数据,得到总数据集。
其中,所述利用总权重集得到候选的弱分类器包括:
利用总权重集计算得到权重矢量;
将所述权重矢量归一化;
利用归一化后的权重矢量得到候选的弱分类器。
其中,在所述S102之前,还包括:
清空候选的弱分类器的集合。
一种基于聚类的dynmaic-TrAdaboost迁移学习分类的装置,包括:
总权重集获取模块,利用总数据集得到总数据集的总权重集,并设置第一权重值跟踪指数,其中所述总数据集为源数据集的带权重数据与目标数据集的带权重数据的组合;
弱分类器计算模块,用于在总数据集中调用基分类器,并利用总权重集得到候选的弱分类器;
判断模块,判断所述弱分类器是否满足预设目标分类器条件,若是,则利用所述弱分类器计算得到目标分类器,利用所述目标分类器对未分类数据进行分类;
动态因子计算模块,用于所述弱分类器没有满足预设目标分类器条件时,计算所述弱分类器在目标数据集上的误差,并利用所述误差计算得到动态因子;
权重值跟踪指数设置模块,用于设置第二权重值跟踪指数;
第一更新模块,用于利用所述第一权重值跟踪指数、所述第二权重值跟踪指数与所述动态因子,更新总权重集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710547008.3/2.html,转载请声明来源钻瓜专利网。