[发明专利]一种利用特权信息进行排序转移的分类方法有效
申请号: | 201910570524.7 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110472748A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 刘倩;刘波;肖燕珊;李松松;刘芷菁 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06N20/10 | 分类号: | G06N20/10 |
代理公司: | 44329 广东广信君达律师事务所 | 代理人: | 杨晓松<国际申请>=<国际公布>=<进入 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特权信息 排序支持向量机 标记样本 恒定 实际距离 分类器 训练样本集 训练样本 负样本 间距比 训练集 正样本 排序 样本 学习 分类 | ||
1.一种利用特权信息进行排序转移的分类方法,其特征在于,包括以下步骤:
S1:利用正标记样本和提取的可靠负样本,建立代表性的正原型和代表性的负原型;
S2:为剩下的未标记样本创建两个相似性权重m+(x)和m-(x);
S3:将正样本PS、负样本NS、未标记样本及其相似权结合到排序支持向量机的学习模型中,得到扩展的第一排序支持向量机模型;
S4:在特权信息x*上训练扩展的第一排序支持向量机模型,得到排序函数f*(x*)=<w*,x*>;
S5:采用步骤S4得到的排序函数计算两个样本之间的间距
S6:用样本间距ρij、ρik、ρkj分别去代替所有样本对之间的恒定间距1,得到扩展的第二排序支持向量机模型;
S7:在普通训练样本x上训练扩展的第二排序支持向量机模型,最后得到相应的最优解。
2.根据权利要求1所述的一种利用特权信息进行排序转移的分类方法,其特征在于,所述步骤S1建立代表性的正原型和代表性的负原型的具体步骤如下:
S1-1:利用Spy技术和Rocchio技术提取可靠的负样本,分别为子集S1和S2;
S1-2:确定最可靠的负样本:NS=S1∩S2;
S1-3:从未标记样本中删除最可靠的负样本:US=US-NS;
S1-4:利用K均值聚类将NS中的样本聚类成m个微聚类,表示为NS1,NS2,…,NSm,来建立代表性的正原型和代表性的负原型。
3.根据权利要求2所述的一种利用特权信息进行排序转移的分类方法,其特征在于,所述步骤S1-4中,建立的代表性的正原型和代表性的负原型表示如下:
正原型:
负原型:
其中,||x||表示示例x的范数;α、β、t均为设置参数;第v个代表性正原型表示为pv和第v个代表性负原型表示为nv。
4.根据权利要求1所述的一种利用特权信息进行排序转移的分类方法,其特征在于,所述步骤S2为剩下的未标记样本创建两个相似性权重m+(x)和m-(x)的具体步骤如下:
S2-1:将剩下的未标记样本US中的样本聚类为r个微聚类,即US1,US2,…,USr;
S2-2:利用基于局部相似机制和全局相似机制生成相似权重;
S2-3:将权重分配给r个微聚类中的每个样本。
5.根据权利要求4所述的一种利用特权信息进行排序转移的分类方法,其特征在于,所述步骤S2-2利用基于局部相似机制和全局相似机制生成相似权重的具体步骤如下:
1)局部相似机制:假设有样本最接近正原型pv,以及有样本最接近负原型nv,u=1…r;
对于样本满足:
对于样本满足:
其中,
由上式可计算未标记样本相应的相似权重:
2)全局相似机制:对于US中的未标记样本xk,计算其与每一个具有代表性的正、负原型相似性;
对每一个未标记样本,对正类和负类的相应权重计算如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910570524.7/1.html,转载请声明来源钻瓜专利网。