[发明专利]一种平均错分代价最小化的分类器集成方法有效
| 申请号: | 201110126230.9 | 申请日: | 2011-05-15 |
| 公开(公告)号: | CN102184422A | 公开(公告)日: | 2011-09-14 |
| 发明(设计)人: | 付忠良;赵向辉;姚宇;李昕 | 申请(专利权)人: | 中科院成都信息技术有限公司 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 成都赛恩斯知识产权代理事务所(普通合伙) 51212 | 代理人: | 朱月仙;张帆 |
| 地址: | 610041 *** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 平均 代价 最小化 分类 集成 方法 | ||
1.一种多分类代价敏感学习的分类器集成方法,包括以下步骤:
S1、获取训练样本集;
S2、初始化样本权值并赋初值;
S3、迭代T次后,训练得到T个最佳弱分类器;
S4、组合T个最佳弱分类器得到最佳组合分类器,
其特征在于:
所述步骤S2给训练样本赋初值的方法为:其中,i=1,...,m,l=1,...,K,yi∈{1,2,...,K},Z0为的归一化因子,c(yi,l)表示yi类被错分成l类的代价,m为训练样本数;
所述步骤S3具体包括如下步骤:
S31、基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:
S311、对应样本集S的划分,计算其中j=1,...,nt,l表示多分类问题中的类,xi表示第i个样本,表示划分段内l标签子集不包含xi的概率;
S312、定义弱分类器ht(x),当时,有其中,ht(x,l)为弱分类器ht(x)输出标签l的置信度;
S313、选取弱分类器ht(x),使最小,其中,Zt代表样本权值调整后的归一化因子;
S32、根据步骤S31的结果来调整样本权值,
S33、判断t是否小于T,若是,则令t=t+1,返回步骤S31,若否,则进入步骤S4。
2.根据权利要求1所述的方法,其特征在于:所述步骤S4得到最佳组合分类器的方法为:其中
3.一种利用权利要求1所述的方法实现的多分类连续AdaBoost集成学习方法,包括以下步骤:
S1、获取训练样本集;
S2、初始化样本权值并赋初值;
S3、迭代T次后,训练得到T个最佳弱分类器;
S4、组合T个最佳弱分类器得到最佳组合分类器,
其特征在于:
所述步骤S2给训练样本赋初值的方法为:i=1,...,m,l=1,...,K,Z0是归一化因子,其中c(i,i)=0,当i≠j时c(i,j)=1;
所述步骤S3具体包括如下步骤:
S31、基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:
S311、对应样本集S的划分,计算其中j=1,...,nt,l表示多分类问题中的类,xi表示第i个样本,相当于划分段内l标签子集不包含xi的概率;
S312、定义弱分类器ht(x),当时,有其中,ht(x,l)为弱分类器ht(x)输出标签l的置信度;
S313、选取弱分类器ht(x),使最小,其中,Zt代表样本权值调整后的归一化因子;
S32、根据步骤S31的结果来调整样本权值,
S33、判断t是否小于T,若是,则令t=t+1,返回步骤S31,若否,则进入步骤S4。
4.根据权利要求3所述的方法,其特征在于:所述步骤S4得到最佳组合分类器的方法为:其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院成都信息技术有限公司,未经中科院成都信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110126230.9/1.html,转载请声明来源钻瓜专利网。





