[发明专利]纵向联邦k-Means隐私保护方法、装置及电子设备有效

专利信息
申请号: 202110471977.1 申请日: 2021-04-29
公开(公告)号: CN113239393B 公开(公告)日: 2022-03-22
发明(设计)人: 唐飞;侯瑞琦;梁世凯 申请(专利权)人: 重庆邮电大学
主分类号: G06F21/62 分类号: G06F21/62;G06F21/60;G06K9/62
代理公司: 重庆辉腾律师事务所 50215 代理人: 卢胜斌
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 纵向 联邦 means 隐私 保护 方法 装置 电子设备
【说明书】:

发明属于数据挖掘技术领域,涉及一种纵向联邦k‑Means隐私保护方法、装置及电子设备;所述方法包括参与者对样本数据加密并上传至云服务器;云服务器随机选取出聚类中心,利用安全乘法协议计算出参与者的子距离差发送给参与者;参与者将收到的子距离差划分份额分发,计算自身持有和收到的份额之和发送给云服务器;云服务器将样本划分到距离最近的聚类中心所在的聚类中;按照聚类结果计算出每个聚类中所有样本的每个特征之和,更新聚类中心;直至聚类中心不发生变化或者变化很小,云服务器将聚类结果返回给参与者;本发明充分保护了参与者的数据隐私,并且本发明不向参与者泄露新的聚类中心,能够抵抗合谋攻击从而具有更高的安全性。

技术领域

本发明属于数据挖掘技术领域,涉及一种纵向联邦k-Means隐私保护方法、装置及电子设备。

背景技术

随着互联网的快速发展,进入了大数据时代,而数据挖掘技术可以从大量的数据中分析并提取隐藏的关键数据信息,从而被广泛的应用到各个领域。聚类算法是数据挖掘技术中常用的方法,其中k-Means聚类算法因其步骤简单、效果较好的优点被经常使用。k-Means算法通过计算样本和聚类中心的距离,把每个样本划分到距离它最近的聚类中,使得一个聚类中的样本相似度很高。但是现实的情况中,数据往往分布在多个数据拥有者上,并且往往包含许多隐私信息,因此如何在保证数据拥有者隐私安全的前提下进行数据挖掘,有着非常重要的意义。联邦学习可以在满足数据隐私、安全和监管要求的前提下进行数据分析,能够用于实现具有隐私保护的数据挖掘。

考虑有多个数据拥有者,对数据集按照纵向(即特征纬度)划分,在联合数据集上进行k-Means聚类操作,最终各个数据拥有者都得到k-Means聚类结果。并且,在聚类操作过程中,数据拥有者不泄露自己的原始数据。

以往的k-Means隐私保护方案,大多存在以下问题:

1、现有方案大多是针对数据横向分布情况下的k-Means聚类,对数据纵向分布的k-Means聚类研究不充分;

2、现有方案往往会泄露k-Means聚类过程中的中间信息,比如新的聚类中心,安全性不高;

3、现有方案大多不能抵抗参与者合谋攻击。

发明内容

有鉴于此,本发明的目的在于提供一种纵向联邦k-Means隐私保护方法、装置及电子设备,本发明利用同态加密和数据切分的方式保证隐私安全。利用云服务器进行k-Means聚类算法中的大部分操作,减轻参与者的计算压力;通过采用对数据进行切分的方式,充分保护了参与者的数据隐私,并且本发明不向参与者泄露新的聚类中心,能够抵抗合谋攻击从而具有更高的安全性。

为达到上述目的,本发明提供如下技术方案:

在本发明的第一方面,本发明提供了一种纵向联邦k-Means隐私保护方法,所述方法包括:

参与者分别对自身的样本数据加密,并上传至云服务器;

云服务器随机选取出k个聚类中心,并利用安全乘法协议计算出每个参与者的子距离差,并将子距离差发送给对应的参与者;

每个参与者将收到的子距离差划分份额,自身保留一份份额后继续分发剩余份额给其他参与者,计算自身保留的份额和收到的份额之和,并将结果发送给云服务器;

云服务器计算所有参与者发送的子距离差份额,确定每个样本距离最近的聚类中心,将样本划分到距离最近的聚类中心所在的聚类中;

云服务器按照聚类结果计算出每个聚类中所有样本的每个特征之和,更新聚类中心;

云服务器判断出新的聚类中心与原聚类中心之间的距离差值是否小于阈值;

若小于阈值,则结束聚类操作,否则用新的聚类中心代替原聚类中心,并进行下一轮迭代。在本发明的第二方面,本发明还提供了一种纵向联邦k-Means隐私保护装置,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110471977.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top