[发明专利]一种存在部分缺失和未知类别标记的多标记分类方法在审
申请号: | 202010870298.7 | 申请日: | 2020-08-26 |
公开(公告)号: | CN112132186A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 黄俊;屈喜文;郑啸;陶陶;袁志祥;程泽凯;秦锋 | 申请(专利权)人: | 安徽工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F17/16 |
代理公司: | 安徽知问律师事务所 34134 | 代理人: | 平静 |
地址: | 243002 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存在 部分 缺失 未知 类别 标记 分类 方法 | ||
1.一种存在部分缺失和未知类别标记的多标记分类方法,其特征在于,其步骤为:
步骤一、对训练数据进行特征提取和类别标注,获得数据特征表示矩阵X和已知类别标记矩阵Y;
步骤二、计算特征表示矩阵X和已知类别标记矩阵Y的相似度矩阵S;
步骤三、将相似度矩阵S分解得到保持样本相似性结构信息的完整类别标记矩阵的近似表示H,并约束得到的近似表示H的部分结果与步骤一得到的已知类别标记矩阵Y的结果一致;
步骤四、利用矩阵重构技术对完整类别标记矩阵的近似表示H进行优化,将H优化为重构结果HC;
步骤五、构建从数据特征表示矩阵X映射到完整类别标记矩阵的重构结果HC的线性分类模型,并对模型系数W做稀疏约束,学习类属特征;同时,利用模型系数W对新发现标记进行语义描述;
步骤六、采用流行正则约束任意两个类别标记对应的模型系数的相似性,进而优化完整标记矩阵H的结果;
步骤七、给定一个测试样本t,将测试样本t带入经过步骤一至六学习得到的最终分类模型,输出测试样本在已知类别标记和未知类别标记上的预测结果。
2.根据权利要求1所述的一种存在部分缺失和未知类别标记的多标记分类方法,其特征在于:所述的步骤一中,为一个二维实数矩阵,n为样本个数,d为特征个数,为实数域;已知类别的类别标记矩阵Y∈{0,1}n×q存在部分缺失值,q为已知的类别标记个数;设置未知类别标记个数为r,则完整类别标记矩阵是一个大小为n×l的二维矩阵,其中l=q+r表示总类别标记个数,且每个元素取值范围为{0,1}。
3.根据权利要求2所述的一种存在部分缺失和未知类别标记的多标记分类方法,其特征在于:所述的步骤二中,对特征表示矩阵X和已知类别标记矩阵Y进行高斯距离函数计算,得到相似度矩阵其中第i行j列元素Sij可以通过式(1)计算得到,
式(1)中,exp为指数函数,xi和xj分别表示特征表示矩阵X的第i行和第j行,yi和yj分别表示已知类别标记矩阵Y的第i行和第j行;表示xj的k近邻样本集合。
4.根据权利要求3所述的一种存在部分缺失和未知类别标记的多标记分类方法,其特征在于:所述的步骤三中,利用非负矩阵分解技术,将样本相似度矩阵分解为HHT,其中H∈[0,1]n×l作为完整类别标记矩阵的近似表示,HT为H的转置矩阵;通过矩阵P约束近似表示H的部分结果与已知类别标记矩阵Y的结果一致,进而得到最小化目标公式,
其中,Ω∈{0,1}n×n表示需要保持的近邻关系,1表示保持,0表示不保持;为映射矩阵,其取值为一个l×l单位矩阵的前q列,矩阵H为待求解的模型参数,λ0为非负权重系数,取值域为{10-1,100,101}。
5.根据权利要求4所述的一种存在部分缺失和未知类别标记的多标记分类方法,其特征在于:所述的步骤四中,为一重构系数矩阵,对于第i个样本的第j个标记结果Hij,通过该样本在其余标记上的结果来重构,可得矩阵表示形式为H≈HC,进而得到缺失结果的标记值;将完整类别标记矩阵的近似表示H优化为HC,得到更新的最小化目标公式:
其中,矩阵H和C为待求解的模型参数;λ1为非负权重系数,取值域为{100,101,102}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学,未经安徽工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010870298.7/1.html,转载请声明来源钻瓜专利网。