[发明专利]一种基于联邦学习的电力数据安全高效共用方法在审
申请号: | 202210159697.1 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114510741A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 段敬;安毅;禹宁;郝晓伟;武汉伟;张栋;张淑娟;安龙;刘秀;段婕;王艳花;刘海涛;万雪枫 | 申请(专利权)人: | 国网山西省电力公司信息通信分公司;山西星泽汇联科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06F16/215;G06F17/16;G06N20/00;G06Q50/06 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
地址: | 030021 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 电力 数据 安全 高效 共用 方法 | ||
本发明属于智能电力数据共用的实现方法领域,尤其涉及到一种基于联邦学习的电力数据安全高效共用方法。包括以下步骤:S100~在各电力公司中部署数据采集设备;S200~将各电力结点获取到的交互数据存储在各电力公司的本地数据库中;S300~协调方将初始化的模型参数w发送至各个电力结点;S400~各电力结点通过初始模型参数w对其存储数据进行模型训练,S500~各电力结点将求得的凸损失函数的值与模型参数w进行同态加密和致盲操作,并将其传至协调方;S600~协调方放置汇总得到新的模型参数w;S700~协调方根据计算结果,判断当前新的模型参数w是否收敛。本发明保证各电力公司隐私数据,有效防止敏感数据泄露。
技术领域
本发明属于智能电力数据共用的实现方法领域,尤其涉及到一种基于联邦学习的电力数据安全高效共用方法。
背景技术
伴随着物联网技术的高速发展,越来越多的工业系统接入其中,同时由于工业4.0的到来,人工智能领域的相关技术也引入到了工业领域当中,越来越多的工业数据在机器学习模型当中被训练,其中电力能源领域应用更为广泛,但同时,由于各电力公司结点具有相关数据的数据量有限,同时具有隐私保护需求等问题,与广泛应用机器学习技术产生了矛盾,所以针对上述现象,工业界往往引入联邦学习技术进行处理。
联邦学习技术作为一种保护数据隐私的深度学习方法,自2016年被提出以来,受到学术界与工业界的广泛关注。联邦学习是一种关注隐私保护的机器学习技术,在保障源数据不离开本地设备的情况下,多参与方或多计算节点之间开展高效的机器学习。联邦学习是该技术的统称,各数据提供方即电力工业物联网中各个结点构成联邦,共同训练机器学习模型。
联邦学习的基准算法FedSGD与FedAvg算法由McMahan等人于2016年首次提出(McMahan B, Moore E, Ramage D, et al. Communication-Efficient Learning ofDeep Networks from Decentralized Data[C]. // Proc of Machine LearningResearch PMLR, Brookline: Microtome Publishing, 2017: 1273–1282),FedAvg算法相较于FedSGD算法,边缘结点将执行多轮学习,有效减少了协调方与边缘结点的通信轮数。基于这一基准算法,Bonawitz K等人构建了一个可伸缩的联邦学习算法(Bonawitz K ,Eichner H , Grieskamp W , et al. Towards Federated Learning at Scale: SystemDesign[J].2019.),该算法可有效解决不可靠的终端连接与设备突发中断的问题,然而该算法收敛速度慢,且并行效率低下,同时未能解决数据非独立同分布的问题,并不适用于电力能源领域。Xie等人提出了一种异步的联邦学习算法(Xie C , Koyejo S , Gupta I .Asynchronous Federated Optimization[J]. 2019.),并提出了一种时滞模型权重更新方法,但是该算法中若结点上传延迟时间过久,则对最终结果影响较大,不能达到电力领域中数据安全高效共用的需求。基于此,提出一种基于结点聚类的联邦学习方法解决电力领域中因结点数据非独立同分布而无法安全高效共用的问题。
发明内容
本发明为了解决上述问题,提供一种基于联邦学习的电力数据安全高效共用方法。
本发明采取以下技术方案:一种基于联邦学习的电力数据安全高效共用方法,包括以下步骤:
S100~在各电力公司中部署数据采集设备,并选择一个电力公司作为共同信任的协调方;
S200~将各电力结点获取到的交互数据存储在各电力公司的本地数据库中,并通过筛查其中的无用数据、空数据与误报数据,并将数据格式与标准数据格式比对,清除无效数据,达到清洗其中的脏数据;
S300~协调方将初始化的模型参数w发送至各个电力结点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山西省电力公司信息通信分公司;山西星泽汇联科技有限公司,未经国网山西省电力公司信息通信分公司;山西星泽汇联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210159697.1/2.html,转载请声明来源钻瓜专利网。