[发明专利]基于多标签柔性支持向量机的分类方法有效
申请号: | 201210396793.4 | 申请日: | 2012-10-18 |
公开(公告)号: | CN102945371A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 祁仲昂;杨名;张仲非;张正友 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟;施海寅 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于多标签柔性支持向量机的分类方法,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离;然后,在特定的分类目标下对多标签空间中的每个点定义一个邻域,某点的邻域包含在新型的距离度量方法下离中心点最近的几个点;最后,结合每个样本点在多标签空间中的邻域信息,利用提出的一种新的多标签柔性支持向量机分类器进行多标签分类训练。本发明用于利用多标签空间中包含的信息来提高鉴别型分类器在多标签分类中的分类精度,降低噪声标签对分类的影响。 | ||
搜索关键词: | 基于 标签 柔性 支持 向量 分类 方法 | ||
【主权项】:
1.一种基于多标签柔性支持向量机的分类方法,其特征在于,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离,所述新型的距离度量方法为:将多标签训练集表示为
训练集中的每个点
都被标上了多种多样的标签,整个训练集的标签字典组成了S维的多标签空间
多标签训练集中的每个点
在视角
中的特征向量表示为xi,在标签字典中的标签向量表示为di=(di,1,di,2,...,di,S)′,其中di,r ∈{0,1},1≤r≤S表示字典中的第r个标签Tr是否在Ii中出现,同时用yi,r表示Ii的分类标签,yi,r=2·di,r-1,在多标签一对多OneVs All的分类模式中,当一个标签Tr被作为分类目标时,标签字典中其余的标签就会组成一个S-1维的标签特征空间
用ti,r表示Ii在空间
中的特征向量,ti,r=(di,1,...,di,r-1,di,r+1,...,di,S)′,定义
当给定di,k=0or 1时,di,r=0or1的条件概率如下所示:![]()
![]()
P 10 = Δ P ( d i , r = 1 | d i , k = 0 ) = 1 - P 00 ]]>P 01 = Δ P ( d i , r = 0 | d i , k = 1 ) = 1 - P 11 ]]> 将每一个标签Tr的关联度向量标记为gr,gr=(gr,1,...,gr,r-1,gr,r+1,...,gr,S)′,向量的每一个元素表示标签Tr与其他标签的关联度,关联度元素gr,k(k∈{1,...,r-1,r+1,...,S})的定义如下式所示:gr,k=P00·P11+P10·P01,将样本点在空间
中的特征向量与每一个标签Tr关联度向量结合起来,得到多标签空间中一种新型的距离度量方法的定义如下式所示:disr(Ii,Ij)=||(ti,r-tj,r)⊙gr||p,其中⊙表示向量之间的阿达马Hadamard乘积;然后,在特定的分类目标下对多标签空间中的每个点定义一个邻域,某点的邻域包含在新型的距离度量方法下离中心点最近的几个点,所述的邻域的表示方法为:Ii在空间
中用这种新型距离度量方法定义的邻域,不包括Ii自己,表示为
Ii和其领域
中数据点的分类结果相似度高,和非邻域数据点的分类结果相似度低,邻域
的大小u表示Ii在空间
中的最邻近的邻居点的个数,
最后,结合每个样本点在多标签空间中的邻域信息,利用提出的一种新的多标签柔性支持向量机分类器进行多标签分类训练,所述新的多标签柔性支持向量机分类器的建立方法为:将每个点Ii的分类标签yi,r的取值范围从两个点{-1,+1}扩展到了一个柔性范围[-1,+1]内,每个点Ii的柔性分类标签标记为li,r,li,r的取值不仅取决于Ii的分类标签yi,r,还取决于Ii在空间
中最邻近的邻居点的分类标签,li,r的定义如下所示:
D是常量,且0≤D<1,多标签柔性支持向量机的优化式如下:min w 1 2 | | w | | 2 + C Σ i = 1 n | l i , r | ξ i ]]>s . t . ∀ i = 1 n : l i , r ( w T x i + b ^ ) ≥ | l i , r | 2 - | l i , r | ξ i , ξ i ≥ 0 ]]> 其中w,
分别是多标签柔性支持向量机分类器SVM-MSM的系数和偏置,C是常数,ξi是松弛变量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210396793.4/,转载请声明来源钻瓜专利网。