[发明专利]基于区块链及联邦学习的物联网数据共享方法在审
申请号: | 202310333014.4 | 申请日: | 2023-03-30 |
公开(公告)号: | CN116471286A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 杨昆;夏雷;吴优;韩松乔 | 申请(专利权)人: | 上海电信科技发展有限公司 |
主分类号: | H04L67/1095 | 分类号: | H04L67/1095;H04L67/10;H04L67/12;G06N20/00;G06F18/22;G06F18/23 |
代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 屈明明 |
地址: | 200011 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区块 联邦 学习 联网 数据 共享 方法 | ||
本发明涉及一种基于区块链及联邦学习的物联网数据共享方法,包括步骤:提供分层训练模型框架;终端设备层将本地数据标签分布信息上传至边缘计算层,边缘计算层基于标签相似度的节点聚类算法选择部分终端设备作为参与节点并进行设备集群分组,形成集中式训练模型的集群架构;以集群为单位采用联邦学习的方式进行模型训练,直至得到满足预设精度的全局模型,其中,在进行模型训练时,最大限度的将前一步训练的信息代入到当前步训练的权重迭代中,同时对全部终端设备权重进行加权平均,使集中式训练模型与全局模型之间的权重偏移量小于目标偏移量。本发明解决传统方法模型准确性低、安全性差的问题。
技术领域
本发明涉及物联网技术领域,特别涉及一种基于区块链及联邦学习的物联网数据共享方法。
背景技术
随着物联网技术的蓬勃发展,海量物联网终端设备接入网络产生了大规模的本地运行数据。但这些数据大多由持有者独享,一方面造成数据孤岛问题,另一方面阻碍了基于大数据的高质量模型训练,降低了数据服务应用的效果。与此同时,联邦学习的分布式模型推断特性与物联网非常契合,因此基于联邦学习框架进行物联网数据共享的技术成为了研究热点。
目前,已有大量利用人工智能技术对物联网数据进行数据分析和建模,传统的AI模型训练方式却存在数据泄露、数据来源不足等问题。联邦学习是作为解决以上问题而提出的一种新颖的分布式学习机制,将用户数据保存在设备本地而只共享模型参数,保护了用户隐私,因此引起了物联网领域的广泛关注。然而,在物联网中基于联邦学习的数据共享技术仍面临着以下挑战:
(1)模型准确性低。现实世界的物联网中,数据分布常是不平衡的,表现出非独立同分布(Non-IID)特性。每个客户端设备通过自身传感器模块以及不同的使用频率来生成自己的数据集。这些数据集将存储在设备本地,不会与其他终端共享原始数据,进而导致每个设备数据只含有总体数据集中的几个类别,形成数据标签分布不平衡。标签分布不平衡同样会表现非独立同分布分布特性使局部模型权重发散,尤其是在横向联邦学习的训练过程中。最终,共享的全局模型与理想模型之间的差异不断增大,从而减缓收敛速度,恶化学习性能,影响模型训练效率。另外,在实际训练时,为了提高训练效率,往往仅选择部分参与点进行训练,而部分参与点训练可能会导致权重偏移,更加无法保证模型的准确性。
(2)模型安全性差:传统联邦学习系统为中心式架构,其数据信息流是不对称的。本地参与方模型计算更新完后将梯度或者模型参数上传至中央服务器,中央服务器把参与方信息收集后进行全局计算并返回训练结果。整个全局模型更新始终在中央服务器上完成,这容易触发某些设备的好奇心导致单点故障和隐私泄露问题。另外,联邦学习系统中本地设备并不是完全可信的,参与的设备节点可能会转变为一个恶意节点,从而表现出自利行为,从而影响整个联邦学习系统的安全性。
发明内容
为了解决上述问题,本发明提供了一种基于区块链及联邦学习的物联网数据共享方法,解决了传统基于联邦学习的数据共享方法模型准确性低、安全性差的问题。
本发明通过如下方案来实现:一种基于区块链及联邦学习的物联网数据共享方法,包括步骤:
提供训练模型框架,所述训练模型框架自下而上包括终端设备层、边缘计算层和云服务器,所述终端设备层上的所有终端设备、所述边缘计算层上的所有边缘服务器以及所述云服务器之间均建立有数据连接;
设备集群初始化,所述终端设备在接收到训练任务时,将本地数据标签分布信息上传至边缘计算层,所述边缘计算层根据接收到的所述本地数据标签分布信息基于标签相似度的节点聚类算法选择部分终端设备作为参与节点并进行设备集群分组,将每个设备集群内的参与节点分别关联至一个边缘服务器,形成集中式训练模型的集群架构;
以集群为单位采用联邦学习的方式进行模型训练,直至得到满足预设精度的全局模型,其中,在进行模型训练时,最大限度的将前一步训练的信息代入到当前步训练的权重迭代中,同时对全部终端设备权重进行加权平均,使集中式训练模型与全局模型之间的权重偏移量小于目标偏移量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电信科技发展有限公司,未经上海电信科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310333014.4/2.html,转载请声明来源钻瓜专利网。