[发明专利]一种多标签分类方法及装置有效
申请号: | 201510068195.8 | 申请日: | 2015-02-09 |
公开(公告)号: | CN104615730B | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 范莹;于治楼;梁华勇 | 申请(专利权)人: | 浪潮集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种多标签分类方法及装置,该方法包括A1对训练样本进行聚类,并根据聚类后每个训练样本对应的标签的划分正确率对标签进行排序;A2按照标签顺序对每个标签对应的分类器进行排序;A3通过排序后的分类器对待分类数据进行分类。本发明提供的一种多标签分类方法及装置,能够提高多标签分类的正确率。 | ||
搜索关键词: | 一种 标签 分类 方法 装置 | ||
【主权项】:
一种多标签分类方法,其特征在于,包括:A1:对训练样本进行聚类,并根据聚类后每个训练样本对应的标签的划分正确率对标签进行排序,A1包括:S1:根据训练样本的属性将所有训练样本聚类为第一类和第二类;S2:分别计算未记录的每个标签对应的训练样本在第一类中的第一数量和在第二类中的第二数量,以及第一类中其他训练样本的第三数量和第二类中其他训练样本的第四数量;S3:根据每个标签对应的第一数量、第二数量、第三数量和第四数量,计算每个标签的划分正确率,S3包括:按照公式一计算每个标签的划分正确率,其中,公式一为:ci=(|si0‑ti0|+|si1‑ti1|)/n×100%,ci为标签i的划分正确率,si1为标签i对应的第一数量,ti1为标签i对应的第二数量,si0为标签i对应的第三数量,ti0为标签i对应的第四数量,n为样本的总量;S4:记录划分正确率最大的标签;S5:判断未记录的标签的数量是否为1,如果是,则执行步骤S7,否则,执行步骤S6;S6:将当前记录的标签添加到训练样本的属性中,返回S1;S7:记录最后一个标签,按照记录的先后顺序给标签排序;A2:按照标签顺序对每个标签对应的分类器进行排序;A3:通过排序后的分类器对待分类数据进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510068195.8/,转载请声明来源钻瓜专利网。