[发明专利]一种利用数字孪生辅助模型训练的联邦学习方法有效
申请号: | 202310063181.1 | 申请日: | 2023-01-17 |
公开(公告)号: | CN115802389B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 余雪勇;许斌;高昊炜 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;H04W24/06;H04W4/30;G06F9/50;G06N20/00;G06N3/098 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 邱月华 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 数字 孪生 辅助 模型 训练 联邦 学习方法 | ||
1.一种利用数字孪生辅助模型训练的联邦学习方法,其特征在于,包括以下步骤:
依据设备的时延和能耗的参数限制选择在本地进行训练或者利用数字孪生进行训练得到局部模型,包括,
选择在本地进行训练的设备,获取第一局部模型;
选择利用数字孪生进行训练的设备,并根据边缘关联算法进行边缘关联,选择小基站为其构建数字孪生,并利用数字孪生训练,获取第二局部模型;
还包括以下步骤:
选择在本地进行训练的设备将训练获取的第一局部模型上传到小基站;
小基站将收集到的所有局部模型进行边缘聚合,得到边缘模型;
小基站将得到的边缘模型上传到宏基站进行云聚合,得到全局模型,使系统能耗得到有效优化;
所述依据设备的时延和能耗的参数限制选择在本地进行训练或者利用数字孪生进行训练得到局部模型,还包括规定E0是设备k进行局部模型训练的能耗门限值,τk是设备k进行局部模型训练的时延门限值,对于训练方式选择,
若设备k满足在设备处进行局部模型训练的时延和能耗的门限值范围时,则选择在本地进行训练;
若设备k不满足本地训练的时延和能耗的门限值范围时,则连接到小基站利用数字孪生进行训练;
所述选择在本地进行训练的设备,获取第一局部模型中,还包括每个设备k采集的数据集的数据量大小表示为Dk(bit),设备k在本地进行训练的时延表示为:
其中,ε1表示训练每bit数据所需要的CPU周期数,表示设备k的计算能力;
设备k在本地进行训练的能耗表示为:
其中,k0表示有效开关电容,为正常数,取决于芯片结构;
所述选择利用数字孪生进行训练的设备,并根据边缘关联算法进行边缘关联,选择小基站为其构建数字孪生,并利用数字孪生训练,获取第二局部模型,还包括边缘关联算法步骤:
A1:选择需要上传状态信息数据量Sk最大的设备k*,即k*的数据量为使得
A2:若子载波平均的分配给每个工业物联网设备,则设备k*分配的子载波数为I=N/K,其中N表示当前剩余的子载波数量,K表示当前剩余工业物联网设备数量,否则I=[N/K]+1;
A3:更新K′,K′=K′\{k*};
A4:判断S是否为空集,若不是,则为状态信息为的工业物联网设备k*,选择距离即最近的小基站
A5:判断小基站s*可分配的计算资源是否够用,即若够用,则在i∈I范围内循环下述过程:在确定设备和服务器的情况下,找到它们之间信道增益最大的子载波,将找出的信道增益最大的子载波给设备k*,即选择子载波更新
A6:更新返回A1,开始为下一个设备执行边缘关联策略;
A7:若小基站s*可分配的计算资源不够用,则返回A4重新选择合适的小基站;
A8:若小基站可分配的计算资源耗尽,则将小基站移出集合S,如果S是空集,则已经没有能为工业物联网设备构建数字孪生的小基站了,构建阶段结束;
所述选择利用数字孪生进行训练的设备,并根据边缘关联算法进行边缘关联,选择小基站为其构建数字孪生,并利用数字孪生训练,获取第二局部模型,还包括设备k在小基站s中构建的数字孪生表示为DTk,状态信息的数据量大小表示为Sk(bit),设备k向小基站s上传状态信息所需时延和能耗分别表示为:
小基站s为设备k的数字孪生DTk分配用于进行联邦学习训练的计算资源fk,s,计算资源分配矩阵表示为F={fk,s,k∈K,s∈S},小基站s能分配的最大计算资源为Fs,利用数字孪生进行训练产生的时延表示为:
利用数字孪生进行训练产生的时延表示为:
利用数字孪生进行训练产生的能耗表示为:
其中,k1表示有效开关电容,它是一个正常数,只取决于芯片的结构;除此之外,能量消耗还包括在数字空间维护数字孪生的能耗
在联邦学习训练的持续时间内,为工业物联网设备构建数字孪生,该能耗表示为:
所述选择利用数字孪生进行训练的设备,并根据边缘关联算法进行边缘关联,选择小基站为其构建数字孪生,并利用数字孪生训练,获取第二局部模型,对于连接到小基站上的数字空间使用数字孪生进行训练的设备k,训练得到局部模型的总时延和总能耗分别表示为:
这部分利用数字孪生进行训练的设备集合表示为K′,K′是所有设备集合K的子集;
所述选择在本地进行训练的设备将训练获取的第一局部模型上传到小基站,还包括从设备k到小基站的上行链路数据传输采用OFDMA机制,由N个可用的子载波为K个工业物联网设备提供服务,子载波集合表示为N={1,2,3,...,N},由于独占子载波分配,干扰被忽略,所以数据传输速率Rk,s(W)表示为:
其中,BN表示每个子载波的带宽,gk,n,s表示设备k和小基站s之间使用子载波n时的信道增益,W={wk,n,s|wk,n,s∈{0,1},k∈K,n∈N,s∈S}表示子载波分配的矩阵,Pk为设备k的发射功率,本地训练得到的局部模型参数为ωk,数据量大小表示为|ωk|;由此,从设备k上传模型参数到小基站s所需时延和能耗分别表示为:
所述小基站将收集到的所有局部模型进行边缘聚合,得到边缘模型,还包括选择在本地进行训练的设备的局部模型参数和选择利用数字孪生进行训练的设备的局部模型参数,
设小基站s处总共有L个训练好的模型参数,模型参数的聚合方法ωs表示为:
小基站s用于聚合的计算频率表示为fsag,ε2表示聚合每bit数据所需要的CPU周期数,小基站s处进行参数聚合产生的时延表示为:
小基站s处进行参数聚合产生的能耗表示为:
所述小基站将得到的边缘模型上传到宏基站进行云聚合,得到全局模型,使系统能耗得到有效优化,还包括S个小基站都完成边缘聚合后,再将各自聚合得到的边缘模型上传到宏基站上的云服务器中进行全局聚合表示为:
之后云服务器再将最终聚合得到的全局模型参数下发给各个终端设备作为下一轮迭代的初始模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310063181.1/1.html,转载请声明来源钻瓜专利网。