[发明专利]一种基于动态契约理论的车联网联邦学习激励方法在审

申请号：	202210331207.1	申请日：	2022-03-31
公开（公告）号：	CN114647982A	公开（公告）日：	2022-06-21
发明（设计）人：	陈俣欣;刘园	申请（专利权）人：	东北大学
主分类号：	G06F30/27	分类号：	G06F30/27;G06N20/00;G06F111/04;G06F111/08
代理公司：	沈阳东大知识产权代理有限公司 21109	代理人：	李在川
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于动态契约理论联网联邦学习激励方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于动态契约理论的车联网联邦学习激励方法，其特征在于：包括以下步骤：

步骤1：建立车联网客户端和联邦学习服务器的效用模型，通过满足IR、IC、IIR和IIC约束条件，构建两期动态契约模型，得到最优动态契约；

步骤2：使用步骤1得到的最优动态契约与车联网客户端进行签约；

步骤3：在动态契约的第一阶段，签约的车联网客户端从联邦学习服务器下载全局模型，对全局模型进行本地训练得到本地模型，将训练完成的本地模型上传到联邦学习服务器；

步骤4：联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值，若满足设定精度阈值，联邦学习服务器接收车联网客户端上传的本地模型并按照第一阶段最优动态契约发放相应的奖励，反之则不接收车联网客户端上传的本地模型并不发放奖励；

步骤5：在动态契约的第二阶段，签约的车联网客户端从联邦学习服务器下载全局模型，对全局模型进行本地训练得到本地模型，将训练完成的本地模型上传到联邦学习服务器；

步骤6：联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值，若满足设定精度阈值，联邦学习服务器接收车联网客户端上传的本地模型并按照第二阶段最优动态契约发放相应的奖励，反之则不接收车联网客户端上传的本地模型并不发放奖励。

2.如权利要求1所述基于动态契约理论的车联网联邦学习激励方法，其特征在于：所述步骤1的具体过程，包括以下步骤：

步骤1.1：建立车联网客户端的成本模型、效用模型，建立联邦学习服务器的效用模型；

设定类型为m的车联网客户端训练的数据大小为D_m，训练截止时间为T_m，其训练数据的CPU频率为f_m，每轮CPU周期的消耗成本为其中，k为常数；当类型为m的车联网客户端训练的数据大小为D_m时，需要消耗的CPU周期为pD_m，其中，p为常数；类型为m型车辆的CPU频率具体包括以下步骤：

步骤1.1.1：建立类型为m的车联网客户端的成本模型，如式(1)所示：

设定μ＝kp³，其中，μ为常数；将定义为类型为m的车联网客户端的私有信息，表示类型为m的车联网客户端基于训练时间的数据训练能力；类型为m的车联网客户端的成本模型，如式(2)所示：

C_m＝μθ_m[D_m]³ (2)

步骤1.1.2：建立类型为m的车联网客户端的效用模型U_v，如式(3)所示：

U_v＝R_m-C_m＝R_m-μθ_m[D_m]³ (3)

其中，R_m为类型为m的车联网客户端从联邦学习服务器收到的奖励；

步骤1.1.3：联邦学习服务器从类型为m的车联网客户端上传的本地模型中获得的收益G_m，如式(4)所示：

G_m＝σlog(1+αD_m) (4)

其中，σ和α基于数据大小确定模型精度对联邦学习服务器收益的影响；

建立联邦学习服务器的效用模型U_s，如式(5)所示：

其中，N代表有N个车联网客户端参与联邦学习训练，q_m代表类型为m的车联网客户端的先验概率分布，R_m为联邦学习服务器为类型为m的车联网客户端发放的奖励；

步骤1.2：建立动态契约第二阶段和第一阶段的车联网客户端的效用模型、两阶段的最优契约模型；具体分为以下步骤：

步骤1.2.1：建立第二阶段的类型为n的车联网客户端的效用模型，如式(6)所示：

其中，代表第一阶段类型为m第二阶段类型为n的车联网客户端的私有信息；

第二阶段类型为n的车联网客户端在选择契约时获得非负效用，满足IR(Individual Rationality)约束条件，如式(7)所示：

其中，X为常数，表示第二阶段类型为n的车联网客户端最小可接受效用；

第二阶段类型为n的车联网客户端在选择和自身类型相同的契约时获得最大效用，满足IC(Incentive Compatibility)约束条件，如式(8)所示：

其中，和为选取最适合自身契约情况下的第二阶段的奖励和训练数据大小；和为选取其他契约情况下第二阶段的奖励和训练数据大小；

步骤1.2.2：建立第一阶段的类型为m的车联网客户端的跨期效用模型，如式(9)所示：

其中，为类型为m的车联网客户端在第一阶段的私有信息；δ为折扣因子；表示第二阶段先验概率分布；

第一阶段类型为m的车联网客户端应满足IIR(Intertemporal IndividuallyRational)约束条件，如式(10)所示：

同时满足IIC(Intertemporal Incentive Compatibility)约束条件，如式(11)所示：

两阶段满足IR，IC，IIR和IIC约束条件时，两期动态合同的优化问题，如式(12)-式(16)所示：

其中,为联邦学习服务器在第一阶段的效用，为联邦学习服务器在第二阶段的效用；

步骤1.3：放松IR、IC、IIR、IIC约束条件，得到联邦学习服务器和车联网客户端的最优动态合约；

对步骤1.2中的IR约束进行放松约束，如式(17)所示：

对步骤1.2中的IC约束进行放松约束，如式(18)所示：

对步骤1.2中的IIR约束进行放松约束，如式(19)所示：

对步骤1.2中中的IIC约束进行放松约束，如式(20)所示：

通过放松步骤1.2中的约束条件，两期动态合同的优化问题，如式(21)-式(25)所示：

在放松后约束条件下，式(21)-式(25)，通过拉格朗日函数可以得到最终的最优动态契约。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210331207.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种分布式存储的卷映射管理方法、系统及相关装置
下一篇：一种危重症护理用体位转换辅助设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于动态契约理论的车联网联邦学习激励方法在审

专利文献下载