[发明专利]一种具有缺失核的多视图聚类机器学习方法在审
申请号: | 201810909626.2 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109117881A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 郑军;刘新旺 | 申请(专利权)人: | 聚时科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200082 上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 填充 优化目标函数 机器学习 均值聚类 视图聚类 多核 获取目标 联合优化 目标数据 数据样本 交替法 求解 映射 样本 融合 | ||
1.一种具有缺失核的多视图聚类机器学习方法,其特征在于,该方法将填充与聚类相融合,在聚类的引导下填充缺失核,用填充的核进行聚类,包括以下步骤:
1)获取目标数据样本和聚类目标数,将所述目标数据样本映射至多核空间;
2)建立缺失多核k-均值聚类优化目标函数;
3)采用循环方式求解所述缺失多核k-均值聚类优化目标函数,实现聚类。
2.根据权利要求1所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述缺失多核k-均值聚类优化目标函数具体为:
HTH=Ik,
βT1m=1,βp≥0,
其中,H表示一中间参数,β表示核系数,Kp表示第p个核矩阵,m表示总核数,I表示单位矩阵,n表示样本个数,k表示聚类簇数,表示所有元素都为1的列向量,sp表示第p个核的索引,表示子核矩阵。
3.根据权利要求1所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述缺失核具体为基核行和列的缺失。
4.根据权利要求2所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述步骤3)中,采用三步交替法求解所述缺失多核k-均值聚类优化目标函数。
5.根据权利要求4所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述三步交替法具体包括:
i)固定β和优化H;
ii)固定β和H,优化
iii)固定H和优化β。
6.根据权利要求5所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述优化H时,将缺失多核k-均值聚类优化目标函数转化为传统核k-均值聚类问题。
7.根据权利要求5所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述优化时,具体包括以下步骤:
101)将缺失多核k-均值聚类优化目标函数转化为:
102)将步骤101)中的方程分解为m个独立的子问题,所述子问题的方程为:
其中,U=In-HHT,p=1,2,...,m;
103)将Kp分解为且则将步骤102)中的优化方程转化为:
其中,
104)获得最优的解析解:
105)计算获得最优的Kp:
8.根据权利要求5所述的具有缺失核的多视图聚类机器学习方法,其特征在于,所述优化β时,将缺失多核k-均值聚类优化目标函数转化为带有线性约束的二次规划问题。
9.根据权利要求1所述的具有缺失核的多视图聚类机器学习方法,其特征在于,循环过程的终止条件为:
(obj(t-1)-obj(t))/obj(t)≤ε0
其中,obj(t)、obj(t-1)分别表示第t、t-1轮迭代的目标函数值,ε0为设定精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于聚时科技(上海)有限公司,未经聚时科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810909626.2/1.html,转载请声明来源钻瓜专利网。