[发明专利]联邦谱聚类方法、装置及电子设备在审

专利信息
申请号: 202211733988.3 申请日: 2022-12-22
公开(公告)号: CN116127340A 公开(公告)日: 2023-05-16
发明(设计)人: 樊继聪 申请(专利权)人: 深圳市大数据研究院
主分类号: G06F18/23 分类号: G06F18/23;G06N20/20
代理公司: 北京智信四方知识产权代理有限公司 11519 代理人: 刘真
地址: 518172 广东省深圳市龙岗*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 联邦 谱聚类 方法 装置 电子设备
【说明书】:

本公开实施例公开了一种联邦谱聚类方法、装置及电子设备,该方法包括:中央服务器将第s‑1轮全局字典矩阵广播给参与第s轮联邦学习的各客户端,以便各客户端基于第s‑1轮全局字典矩阵更新第s轮本地字典矩阵和第s轮本地系数矩阵,然后根据各客户端的第s轮本地字典矩阵确定第s轮全局字典矩阵,直至s达到预设的最大训练次数或第s轮全局字典矩阵收敛;此时,再根据相应客户端的最后轮次本地字典矩阵和最后轮次本地系数矩阵,得到最后轮次全局字典矩阵和最后轮次全局系数矩阵,并将据此构建的相似度矩阵进行谱聚类得到谱聚类的结果,并将谱聚类的结果广播给各客户端。该技术方案可以提高联邦谱聚类算法的安全性和有效性。

技术领域

本公开涉及数据处理技术领域,具体涉及一种联邦谱聚类方法、装置及电子设备。

背景技术

谱聚类是一种非常有效的聚类算法,广泛应用于各种数据分析任务中。谱聚类算法需要将数据存储在一个计算节点(或设备)或者需要进行数据传输以构造数据点之间的相似度矩阵,因此不能保护数据隐私,不能满足很多应用场景的需求。为解决该问题,若干研究者提出了联邦谱聚类算法。目前联邦谱聚类算法主要基于谱聚类的分布式算法,通过特征分解与对齐的方法来保证传输信息的安全性,并尽可能避免用户本地数据泄露。现有的联邦谱聚类算法的实现步骤主要为:

1、任意选取一个客户端作为中心节点,对中心节点的本地数据做谱聚类得到对应的特征向量,对得到的特征向量做K-means聚类,得到中心节点中的各数据点以及对应的特征向量,随机选取本地数据中的一个数据点Di,将数据点Di及与之对应的特征向量Vi广播给其它客户端;

2、其它客户端接收到中心节点广播的数据点Di和特征向量Vi,并将该数据点Di与自己的本地数据结合进行奇异值分解,得到一组特征向量;在特征向量的每一维,将新计算的一组特征向量与被广播的特征向量Vi进行符号对齐,在对这些特征向量进行符号对齐之后,对其进行K-means聚类得到局部类簇中心,并将所得局部类簇中心回传给中心节点。

3、中心节点对得到的其他客户端发送的所有局部类簇中心再次进行K-means聚类得到全局类簇中心,并将得到的全局类簇中心广播给其他全部客户端,以使他们能够在本地对新到的数据点进行聚类。

通过上述步骤可以看到,现有的方案需要随机选取一个客户端作为数据集结的中心节点,仅利用了该中心节点的一个数据点及其特征向量,完成分布式存储数据的特征向量对齐,最大限度保证了用户数据不出本地。然而,上述方法仍然需要暴露中心节点的至少一个数据点给其它所有客户端,使得该联邦谱聚类的数据安全性无法得到保障,而且上述方法使用奇异值分解(SVD,Singular Value Decomposition)和K-means方法构建联邦谱聚类的模型,没有显式地构建所需的相似度矩阵,与谱聚类方法有较大差异,使得该联邦谱聚类的有效性也无法得到保障。因此,如何破解现有的联邦谱聚类算法存在的安全性和有效性问题成为行业亟待解决的难题。

发明内容

为了解决相关技术中的问题,本公开实施例提供一种联邦谱聚类方法、装置及电子设备。

第一方面,本公开实施例中提供了一种联邦谱聚类方法。

具体地,所述联邦谱聚类方法,包括:

获取第0轮全局字典矩阵;

将第s-1轮全局字典矩阵广播给参与第s轮联邦学习的各客户端,以便所述各客户端基于所述第s-1轮全局字典矩阵更新各客户端的第s轮本地字典矩阵和第s轮本地系数矩阵,其中,所述s取值为1、2、3、……;

接收各客户端发送的所述各客户端的第s轮本地字典矩阵,并根据所述各客户端的第s轮本地字典矩阵确定第s轮全局字典矩阵,直至所述s达到预设的最大训练次数或所述第s轮全局字典矩阵收敛;

从参与最后一轮联邦学习的各客户端中获取最后轮次本地字典矩阵,从全部客户端中获取各客户端的最后轮次本地系数矩阵;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大数据研究院,未经深圳市大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211733988.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top