[发明专利]一种具有缺失核的多视图聚类机器学习方法在审
申请号: | 201810909626.2 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109117881A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 郑军;刘新旺 | 申请(专利权)人: | 聚时科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200082 上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 填充 优化目标函数 机器学习 均值聚类 视图聚类 多核 获取目标 联合优化 目标数据 数据样本 交替法 求解 映射 样本 融合 | ||
本发明涉及一种具有缺失核的多视图聚类机器学习方法,该方法将填充与聚类相融合,在聚类的引导下填充缺失核,用填充的核进行聚类,包括以下步骤:1)获取目标数据样本,将所述目标数据样本映射至多核空间;2)建立缺失多核k‑均值聚类优化目标函数;3)采用三步交替法求解所述缺失多核k‑均值聚类优化目标函数,实现聚类。与现有技术相比,本发明考虑填充和聚类的联合优化,具有聚类效果好等优点。
技术领域
本发明属于计算机视觉和模式识别技术领域,涉及一种多视图聚类方法,尤其是涉及一种具有缺失核的多视图聚类机器学习方法。
背景技术
近年来,大量的研究致力于设计有效的多视图聚类算法。它们的目的是通过基核的最优组合来对数据进行聚类。例如,文献“Multiple kernel clustering”(B.Zhao,J.T.Kwok,and C.Zhang,in SDM,2009,pp.638–649)提出同时找到最大间隔超平面、最佳聚类标签和最优核。在文献“Optimized data fusion for kernel k-means clustering”(S.Yu,L.-C.Tranchevent,X.Liu,W.J.A.K.Suykens,B.D.Moor,and Y.Moreau,IEEE TPAMI,vol.34,no.5,pp.1031–1039,2012)中提出一种新的k-均值核优化算法来联合多个数据源进行数据分析。文献“Localized data fusion for kernel k-meansclustering with application to cancer biology”(M.and A.A.Margolin,inNIPS,2014,pp.1305–1313)中,核的组合权重可以自适应调整来捕捉样本的特点。用l2,1-范数替代k-均值的均方误差,文献“Robust multiple kernel k-means clustering usingl21-norm”(L.Du,P.Zhou,L.Shi,H.Wang,M.Fan,W.Wang,and Y.-D.Shen,in IJCAI,2015,pp.3476–3482)设计了一种鲁棒的多核k-均值算法,这种方法可以同时找到最佳的聚类标签和最优的核组合。文献“Multiple kernel k-means clustering with matrix-inducedregularization”(X.Liu,Y.Dou,J.Yin,L.Wang,and E.Zhu,in AAAI,2016,pp.1888–1894)设计了一种矩阵导出正则化方法来减少冗余,同时提升精选核的多样性。这些算法已经被应用到各种应用,并展现了很好的聚类效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于聚时科技(上海)有限公司,未经聚时科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810909626.2/2.html,转载请声明来源钻瓜专利网。