[发明专利]一种基于动态契约理论的车联网联邦学习激励方法在审
申请号: | 202210331207.1 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114647982A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 陈俣欣;刘园 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N20/00;G06F111/04;G06F111/08 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 契约 理论 联网 联邦 学习 激励 方法 | ||
1.一种基于动态契约理论的车联网联邦学习激励方法,其特征在于:包括以下步骤:
步骤1:建立车联网客户端和联邦学习服务器的效用模型,通过满足IR、IC、IIR和IIC约束条件,构建两期动态契约模型,得到最优动态契约;
步骤2:使用步骤1得到的最优动态契约与车联网客户端进行签约;
步骤3:在动态契约的第一阶段,签约的车联网客户端从联邦学习服务器下载全局模型,对全局模型进行本地训练得到本地模型,将训练完成的本地模型上传到联邦学习服务器;
步骤4:联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值,若满足设定精度阈值,联邦学习服务器接收车联网客户端上传的本地模型并按照第一阶段最优动态契约发放相应的奖励,反之则不接收车联网客户端上传的本地模型并不发放奖励;
步骤5:在动态契约的第二阶段,签约的车联网客户端从联邦学习服务器下载全局模型,对全局模型进行本地训练得到本地模型,将训练完成的本地模型上传到联邦学习服务器;
步骤6:联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值,若满足设定精度阈值,联邦学习服务器接收车联网客户端上传的本地模型并按照第二阶段最优动态契约发放相应的奖励,反之则不接收车联网客户端上传的本地模型并不发放奖励。
2.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法,其特征在于:所述步骤1的具体过程,包括以下步骤:
步骤1.1:建立车联网客户端的成本模型、效用模型,建立联邦学习服务器的效用模型;
设定类型为m的车联网客户端训练的数据大小为Dm,训练截止时间为Tm,其训练数据的CPU频率为fm,每轮CPU周期的消耗成本为其中,k为常数;当类型为m的车联网客户端训练的数据大小为Dm时,需要消耗的CPU周期为pDm,其中,p为常数;类型为m型车辆的CPU频率具体包括以下步骤:
步骤1.1.1:建立类型为m的车联网客户端的成本模型,如式(1)所示:
设定μ=kp3,其中,μ为常数;将定义为类型为m的车联网客户端的私有信息,表示类型为m的车联网客户端基于训练时间的数据训练能力;类型为m的车联网客户端的成本模型,如式(2)所示:
Cm=μθm[Dm]3 (2)
步骤1.1.2:建立类型为m的车联网客户端的效用模型Uv,如式(3)所示:
Uv=Rm-Cm=Rm-μθm[Dm]3 (3)
其中,Rm为类型为m的车联网客户端从联邦学习服务器收到的奖励;
步骤1.1.3:联邦学习服务器从类型为m的车联网客户端上传的本地模型中获得的收益Gm,如式(4)所示:
Gm=σlog(1+αDm) (4)
其中,σ和α基于数据大小确定模型精度对联邦学习服务器收益的影响;
建立联邦学习服务器的效用模型Us,如式(5)所示:
其中,N代表有N个车联网客户端参与联邦学习训练,qm代表类型为m的车联网客户端的先验概率分布,Rm为联邦学习服务器为类型为m的车联网客户端发放的奖励;
步骤1.2:建立动态契约第二阶段和第一阶段的车联网客户端的效用模型、两阶段的最优契约模型;具体分为以下步骤:
步骤1.2.1:建立第二阶段的类型为n的车联网客户端的效用模型,如式(6)所示:
其中,代表第一阶段类型为m第二阶段类型为n的车联网客户端的私有信息;
第二阶段类型为n的车联网客户端在选择契约时获得非负效用,满足IR(Individual Rationality)约束条件,如式(7)所示:
其中,X为常数,表示第二阶段类型为n的车联网客户端最小可接受效用;
第二阶段类型为n的车联网客户端在选择和自身类型相同的契约时获得最大效用,满足IC(Incentive Compatibility)约束条件,如式(8)所示:
其中,和为选取最适合自身契约情况下的第二阶段的奖励和训练数据大小;和为选取其他契约情况下第二阶段的奖励和训练数据大小;
步骤1.2.2:建立第一阶段的类型为m的车联网客户端的跨期效用模型,如式(9)所示:
其中,为类型为m的车联网客户端在第一阶段的私有信息;δ为折扣因子;表示第二阶段先验概率分布;
第一阶段类型为m的车联网客户端应满足IIR(Intertemporal IndividuallyRational)约束条件,如式(10)所示:
同时满足IIC(Intertemporal Incentive Compatibility)约束条件,如式(11)所示:
两阶段满足IR,IC,IIR和IIC约束条件时,两期动态合同的优化问题,如式(12)-式(16)所示:
其中,为联邦学习服务器在第一阶段的效用,为联邦学习服务器在第二阶段的效用;
步骤1.3:放松IR、IC、IIR、IIC约束条件,得到联邦学习服务器和车联网客户端的最优动态合约;
对步骤1.2中的IR约束进行放松约束,如式(17)所示:
对步骤1.2中的IC约束进行放松约束,如式(18)所示:
对步骤1.2中的IIR约束进行放松约束,如式(19)所示:
对步骤1.2中中的IIC约束进行放松约束,如式(20)所示:
通过放松步骤1.2中的约束条件,两期动态合同的优化问题,如式(21)-式(25)所示:
在放松后约束条件下,式(21)-式(25),通过拉格朗日函数可以得到最终的最优动态契约。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210331207.1/1.html,转载请声明来源钻瓜专利网。