[发明专利]一种基于结构约束的半监督多视角聚类方法有效
申请号: | 201610041391.0 | 申请日: | 2016-01-22 |
公开(公告)号: | CN105718950B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 王亮;吴书;尹奇跃 | 申请(专利权)人: | 天津中科智能识别产业技术研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300465 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 约束 监督 视角 方法 | ||
本发明公开了一种基于结构约束的半监督多视角聚类方法,该方法通过回归的方式优化多视角数据的结构信息,即归一化类别矩阵,同时利用先验信息直接指导多视角数据结构信息的学习,以进一步对归一化类别矩阵进行结构约束,从而在给定先验信息时可以有效提升多视角聚类性能。考虑到不同视角在学习时所起作用不同,本发明将特征学习嵌入到多视角数据结构信息的学习中以进一步提升聚类性。
技术领域
本发明涉及模式识别技术领域,尤其是一种基于半监督情况下的多视角的数据聚类方法。
背景技术
随着计算机视觉技术与多媒体技术的迅猛发展,数据往往表现出不同的特征描述方法,比如单个网页可以由图片,文本以及超级链接等信息进行描述;图片可有由不同的视觉描述算子(如SIFT和GIST特征)进行编码。以上数据称为多视角数据,每一个视角对应一种特征集。多视角数据的爆炸式增长,促进着多视角学习的发展,并产生广泛的应用。多视角聚类,作为多视角学习的基本任务,旨在挖掘不同视角之间的信息互补特性以提升数据聚类性能。
近些年来,如何利用先验信息,如用户标注的部分样本间的相似性关系,来提升多视角聚类受到了广泛的关注,也称为半监督多视角聚类。这类先验信息具有较强的语义特性,可以有效对多视角聚类进行指导。传统的半监督多视角聚类方法一般采用软正则化(soft regularization)或者硬约束(hard constraints)的方法来使用半监督信息,但是它们不能显式地利用先验信息所表现出来的结构信息对多视角聚类进行指导,同时也不能较好地处理多视角数据特征的选择问题。因此,传统的半监督多视角聚类方法不能有效地提升聚类性能,不能有效的满足半监督多视角聚类的需求。
发明内容
鉴于此,本发明提出了一种基于结构约束的半监督多视角聚类方法。
本发明是这样实现的,一种基于结构约束的半监督多视角聚类方法,包括步骤:
S1,收集多视角数据并提取所述多视角数据的特征;
S2,人工标注部分样本点并以样本点构造样本间相似性关系作为先验信息;
S3,将多视角数据特征进行串联并以回归的方式采用线性投影矩阵的方式学习多视角数据的归一化类别矩阵,该归一化类别矩阵具有非负且列正交的特性;
S4,设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习,并构造优化目标;
S5,将先验信息作为正则项加入到所述优化目标中使先验信息直接约束多视角数据的归一化类别矩阵,形成最终的优化目标函数;
S6,采用交替优化方式求解所述优化目标,直至模型收敛,得到多视角数据的归一化类别矩阵;
S7,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果。
本发明以回归的方式通过线性投影矩阵直接优化多视角数据的结构信息,即归一化类别矩阵,同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征权重学习,构造优化目标,利用先验信息直接约束多视角数据的归一化类别矩阵,指导归一化类别矩阵的学习,对不符合先验信息的归一化类别矩阵的部分进行惩罚,形成最终的优化目标函数,通过交替优化方式优化目标得到多视角数据的归一化类别矩阵,通过处理最终的归一化类别矩阵,得到最终的多视角数据聚类结果,从而起到了有效的聚类。
附图说明
图1是本发明基于结构约束的半监督多视角聚类方法的流程图;
图2是本发明利用先验信息设计正则项的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别产业技术研究院有限公司,未经天津中科智能识别产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610041391.0/2.html,转载请声明来源钻瓜专利网。