[发明专利]一种融合多分类器投票策略的主动学习方法在审
| 申请号: | 202210584071.5 | 申请日: | 2022-05-27 |
| 公开(公告)号: | CN114997298A | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 郭东升;杨挺;韩宇佳;樊继刚;杨萍 | 申请(专利权)人: | 贵州华谊联盛科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 李绩 |
| 地址: | 550016 贵州省贵阳市贵阳国家高新技术产*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 分类 投票 策略 主动 学习方法 | ||
1.一种融合多分类器投票策略的主动学习方法,其特征在于:包括采用多分类器协同投票机制实现无标签样本的标注,将整个样本集分成带标签样本集L和无标签样本集U,利用K-Means聚类算法对初始训练集进行聚类,选择需要标注的样本,将标注后的样本加入到对应的分类器中,并进一步迭代训练,确定迭代终止条件,最后基于多分类器协同标注的TSVM算法,得到最终分类器TSVM。
2.根据权利要求1所述的融合多分类器投票策略的主动学习方法,其特征在于:其具体步骤为:
步骤一:将带标签的样本集L采用K-Means算法进行聚类,并按照一定比例从每个聚类中抽取样本,构成n个子训练集,记为:L1,L2,L,Ln;
步骤二:采用SVM算法训练n个训练子集,得到n个初始分类器:C1,C2,L,Cn;
步骤三:将无标签样本输入C1,C2,L,Cn,这n个初始分类器,得到n个输出结果:f1i,L,
步骤四:对于任意无标签样本xj,若n个分类的分类结果满足公式(1)
那么将其标注为正类;若n个分类的分类结果满足公式(2),
那么将其标注为负类;
步骤五:若当前xj的标注类别与前期标注的类别不一致,那么需要重置标注,并将其从对应的训练集中删除;若当前标注的类别与前期一致,的值与前期的不一致,那么将该样本加入到Lj中;若前期没有对该样本进行标注,那么求满足的j,并把样本加入到Lj中;否则停止迭代,并跳转到步骤八;
步骤六:重复执行步骤四和步骤五,直到标注完所有无标签样本;
步骤七:在得到新的训练子集后,重新训练这些新的子训练集,并得到新的分类器:C1新,C2新,L,Cn新,若存在上一轮与这一轮子训练集没有改变的情况,那么对应的训练还需继续使用上一轮的分类器,然后跳转到步骤三;
步骤八:汇总各个训练子集构成最终的训练集,然后重新训练样本集并得到最终的分类器。
3.根据权利要求1所述的融合多分类器投票策略的主动学习方法,其特征在于:所述多分类器协同投票机制实现无标签样本的标注方法,具体包括:首先,对于有标签的样本集采用聚类后按照比例从每个簇中抽取一定数量的样本构成n(n为奇数,且大于1)个子样本集,作为训练集;其次,根据n个训练集训练得到n个初始分类器C1,C2,…,Cn,然后利用这n个分类器对每个无标签样本进行预测,得到输出f1,f2,…,fn;第三,对无标签样本进行标注,并根据终止条件决定是否进一步迭代。
4.根据权利要求1所述的融合多分类器投票策略的主动学习方法,其特征在于:所述K-Means聚类算法对初始训练集进行聚类,具体步骤如下:
第一步:假设带标签样本集合为L={x1,x2,L,xl},聚类个数为K;迭代轮次为r,且初始值为0;设定初始K个聚类中心为
第二步:假设第i类样本对应的集合为对于任意一个样本xj,j=1,L,l,如果xj距离聚类中心的距离最短,则如公式(3),
那么将样本xj加入类;
第三步:重新计算K个聚类中心,具体如下:
其中,
第四步:定义聚类准则函数,并对聚类误差进行计算,具体如下:
第五步:判断是否达到停止条件,如果|E(t-1)-E(t)|的值小于预设误差值,则最终得到的聚类和聚类中心分别为:否则置r=r+1,跳转到第二步。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州华谊联盛科技有限公司,未经贵州华谊联盛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210584071.5/1.html,转载请声明来源钻瓜专利网。





