[发明专利]一种基于联邦学习的隐私保护图像分类方法在审
申请号: | 202110975055.4 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113642664A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 杜磊;许艳;仲红;刘辉 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F21/62 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 隐私 保护 图像 分类 方法 | ||
本发明公开了一种基于联邦学习的隐私保护图像分类方法,其步骤包括:1服务器获取公共数据并预处理;2服务器初始化并通过洗牌器下发数据至各客户端;3客户端训练本地神经网络;4洗牌器随机子采样客户端;5子采样客户端预测公共数据,扰动并加密后发送给洗牌器;6洗牌器伪造并随机排列预测后发送匿名预测给服务器;7服务器聚合匿名预测并训练全局神经网络;8服务器将训练好的全局神经网络下发至各客户端;9客户端利用训练好的全局神经网络进行图像分类。本发明利用差分隐私和联邦学习,实现了隐私保护的协作式图像分类。
技术领域
本发明涉及异常检测领域,具体地说是一种基于联邦学习的隐私保护图像分类方法。
背景技术
图像分类,是指一个输入图像,输出对该图像内容分类的描述的问题,是计算机视觉的核心。随着技术的迅速发展,图像分类被广泛应用于不同的领域,包括安全监控、人脸识别、医学图像疾病诊断等。目前,图像分类的实现主要基于深度学习方法,一个高精度的深度学习模型的训练依赖于大量高质量的有标记数据。而如今图像分类的数据特点表现为:无标记的数据远多于有标记的数据,大量有标记的数据分布于离散的客户端中且难以被整合。因此,传统的深度学习方法难以适用于现有环境。
作为一种新的分布式深度学习范式,联邦学习(FL)的出现有望打破因数据离散分布而难以使用的问题。通过上传客户端本地训练的深度学习模型的参数,联邦学习使服务器能够在无需整合客户端本地数据的情况下训练一个高精度的深度学习模型,从而将离散分布的数据利用起来。然而,现有的基于联邦学习的图像分类方法难以有效利用大量存在的无标记数据;且客户端的本地数据存在隐私泄露的风险。因此,如何在图像分类问题中有效的利用无标记数据与离散分布的有标记数据仍然需要探索,尤其是在保护隐私的情况下。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于联邦学习的隐私保护图像分类方法,以期能通过标记数据来有效利用无标记的数据,并利用差分隐私技术保护客户端免受隐私泄露的威胁,以实现有效利用无标记数据的图像分类,从而能在提高图像分类精度的同时,保护客户端数据隐私。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于联邦学习的隐私保护图像分类方法的特点是应用于由服务器、洗牌器和N个客户端所组成的网络中,并按如下步骤进行:
步骤1.所述服务器获取无标记的公共数据并进行归一化预处理,得到预处理后的公共数据集记为DP={x1,x2,...,xk,...,xK},xk表示第k个公共样本,k=1,2,...,K,K为公共样本的总数;
步骤2.所述服务器初始化并通过洗牌器下发数据至各客户端:
步骤2.1.所述服务器生成公钥pk和私钥sk;
步骤2.2.所述服务器构造全局神经网络MG;
步骤2.3.所述服务器将公钥pk、全局神经网络MG和公共数据集DP发送给所述洗牌器;
步骤3.所述客户端训练本地神经网络:
步骤3.1.第i个客户端获取本地真实数据并进行归一化预处理,得到预处理后的本地数据集记为Di={(xi,1,yi,1),(xi,2,yi,2),...,(xi,j,yi,j),...,(xi,J,yi,J)},xi,j和yi,j分别表示第i个客户端的第j个本地样本和对应的标记,i=1,2,...,N,N为客户端总数,j=1,2,…,J,J为本地样本总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110975055.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有均匀反光性能的塑胶
- 下一篇:一种舰船辐射噪声数据集的构建方法