[发明专利]一种基于k均值聚类的隐私信息保护方法有效

专利信息
申请号: 201811590868.6 申请日: 2018-12-20
公开(公告)号: CN109615021B 公开(公告)日: 2022-09-27
发明(设计)人: 赖俊祚;李燕玲;王琪;周德华;王传胜 申请(专利权)人: 暨南大学
主分类号: G06K9/62 分类号: G06K9/62;G06F21/60
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 林梅繁
地址: 510632 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 均值 隐私 信息 保护 方法
【说明书】:

发明属于机器学习领域,涉及一种基于k均值聚类的隐私信息保护方法,采用线性同态加密算法LHE结合加法同态加密算法Paillier对数据进行加密,得到密文数据,利用云服务端提供的计算服务实现对密文数据进行k均值聚类,得到密文聚类结果,客户端对密文聚类结果进行解密,得到明文聚类结果。本发明云服务端不获取用户的任何隐私信息,在实现聚类算法的同时保证用户的隐私信息安全,数据分析过程中数据信息不泄露,不仅有效地提高了用户数据的安全性,还大幅度地降低了客户端与云服务端之间的通信量,降低了通信成本,提高了机器学习效率,更适合应用到实际场景中去。

技术领域

本发明属于机器学习领域,涉及一种基于k均值聚类的隐私信息保护方法。

背景技术

随着互联网技术的快速发展,AI技术的再次兴起让机器学习在信息行业得到了广泛的应用,例如医学诊断、搜索引擎、计算机视觉、检测信用卡欺诈、证券市场分析等。机器学习的基本思想是模拟人类的学习行为,通过对大量数据的分析和学习,来获取新的知识或技能,用以改善已有组织结构的性能。更精确的机器学习结果需要更大的数据库作为学习的对象,然而大量的数据包含了用户的隐私信息,这给机器学习的发展带来了新的挑战和机遇。因此在机器学习领域实现数据的安全计算,是当前信息行业急需解决的重要问题,具有重要的理论意义和应用价值。

最近几年,基于大数据的机器学习是目前信息行业最热门的领域之一。数据的爆炸性增长转变了传统机器学习的窘境,大量的数据存储丰富了机器学习的学习资源,给机器学习带来了巨大的发展机遇。在这种数据规模下进行机器学习,可以利用数据的特性更好地帮助各行各业进行发展规划。例如,在医疗方面,根据病人的病例数据学习得到疾病诊断模型;在人脸识别方面,用含有人脸的图像或视频流,通过对图像的检测和跟踪进行身份识别;在商业方面,根据消费者的消费特征,确定商场的主消费人群等。

k均值聚类算法是机器学习中“无监督学习”的一种,通过对无标记数据进行分析学习,发现数据之间存在的某种关系,从而实现对数据的划分或分组处理。在该算法中,训练样本的标记信息是未知的,目标是通过对无标记的信息数据的学习,发现数据中的内在规律,进而对数据进行划分、归类。由于其简单、有效的特性,k均值聚类算法在聚类算法中是比较常用的一种算法,可以用于新闻聚类、用户购买模式、图像与基因技术等领域。

大数据与机器学习的结合发展是信息技术行业的一大优势,但同时也是未来发展的一大挑战。因为大数据的产生源于我们的生活,包含了大量的隐私数据,对于用户的隐私保护已经是社会发展的焦点。为了解决大数据下的计算问题,云计算服务得到许多大、小企业的青睐,由于云服务器的不可信特性,使得用户的隐私安全问题更加严峻。因此,如何在保证数据安全的前提下进行机器学习,已经是当前机器学习发展的重要问题,研究具有隐私保护的机器学习方法是信息行业的发展趋势,具有重要的理论意义和应用价值。

通常情况下,为了防止隐私信息的泄露,用户在上传数据之前会先进行加密,然后把密文上传到云服务器用于机器学习,然而加密数据的方法虽解决了隐私安全的问题,但对密文进行机器学习的运算带来了一定的难度。全同态的加密算法支持密文运算,但是由于全同态的效率很低,导致该加密方法在实际场景中并不实用。

在很多实际的应用场景中,为了保证数据的安全性,数据提供者仅提供训练数据样本的密文形式,云服务器只能在密文上进行机器学习的训练算法,要求在机器学习的过程中,云服务器不能学习到用户隐私信息,数据提供者承担尽可能少的计算工作量。另外,为了保证机器学习的效率,在解决方案中,降低通信成本也是一个要求。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811590868.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top