[发明专利]基于半马尔可夫决策过程车载雾辅助的车队任务卸载方法有效
申请号: | 202110594462.0 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113326076B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 吴琼;王思远;葛红梅 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F9/445 | 分类号: | G06F9/445;H04L67/55 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 张荣 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 半马尔可夫 决策 过程 车载 辅助 车队 任务 卸载 方法 | ||
1.基于半马尔可夫决策过程车载雾辅助的车队任务卸载方法,其特征在于,包括如下步骤:
步骤S1:基于半马尔可夫决策过程定义车载雾辅助的车队任务卸载系统的状态集和动作集;
步骤S2:根据系统的状态集和动作集得到系统当前的状态s和动作a(s),并根据系统当前的状态s和动作a(s)计算系统状态转移概率;
步骤S2中,所述转移概率的计算方法为:分别计算车队发出任务请求时的转移概率、车辆处理的任务离开系统时的转移概率、车载雾中计算单元共同处理的任务离开系统时的转移概率、车辆到达系统时的转移概率、车辆离开系统时的转移概率,并进行归一化;
步骤S3:根据系统奖励和系统状态转移概率建立贝尔曼最优方程并求解系统中的最优卸载策略;
所述系统奖励为系统在状态s采取动作a(s)的系统奖励,表示为系统的立即增益与系统状态转移期间所消耗成本之间的差值,计算如下:
R(s,a)=U(s,a)-G(s,a)
其中U(s,a)表示系统在状态s下采取动作a(s)后,系统的立即增益;G(s,a)表示从当前状态转移到下一状态期间,系统的消耗;
步骤S3中,所述立即增益的表达式为:
其中,η表示时间的单位价格,El表示由任务请求者自身处理时所需的时间,Tp表示车队内传输任务的传输时间,每个任务所需的计算资源为d,车队车辆Vi(i=1,...,N)的计算资源为fi,表示由头车将任务传输给车载雾中j个计算单元共同处理的传输时间,惩罚参数为ζ;
所述Tp和具有相同的计算公式,用Ttr表示:
Ttr=θ·Etr·Tslot
其中θ表示车辆需要传输的任务数,在车队内,其值恒定为1,在头车与车载雾组成的网络中,其值取决于系统的决策,当头车将任务划分为相同大小的j个子任务并分别传输给车载雾中的j辆车,θ的值为j;Etr表示传输任务所需要的平均时隙数;Tslot表示每个时隙的平均时长;
Bj表示由车载雾中j个计算资源共同处理的任务的个数,NR表示单个任务在车载雾中最多能分配到的计算资源数目,表示车队产生计算任务,系统将任务分配到车队车辆Vi中处理,表示系统将任务传输到车载雾中的j个计算单元处理,A表示车队中车辆发出计算任务,F+1和F-1分别表示车辆到达和离开车载雾,表示由车载雾中NR个计算资源共同处理的任务离开系统,e表示当前事件,a为当前系统动作,N为车队中车辆数目,DN表示由车队中车辆VN处理的任务被处理完成,a=-1表示当前事件为由车辆Vi处理的任务离开系统,由车载雾中j个计算资源共同处理的任务离开系统,车辆到达以及车辆离开,此时系统不采取任务动作,M表示车载雾中计算资源的个数,b表示系统丢弃数据包;
步骤S3中,所述系统的消耗为:
其中α表示连续时间折扣因子,C(s,a)是当前状态下采取动作后,系统中正在处理任务的车辆数,其表达式为:
β(x,a)表示系统下一时刻所有事件到达率总和,β(x,a)的计算表达式为:
ni表示车辆Vi处理的任务的个数,ni=0表示车辆Vi为空闲车辆,ni=1表示车辆Vi正在处理任务,Bj表示由车载雾中j个计算资源共同处理的任务的个数,λp为任务到达车队中的车辆的概率,事件F+1和F-1的到达率分别为λv和μv,nk为车辆Vk处理的任务的个数,fk为车辆Vk的计算资源,Bm为由车载雾中m个计算资源共同处理的任务的个数,fi为车辆Vi的计算资源,fv为车载雾中每个车辆的计算资源,Di为车辆Vi处理的任务离开系统,Lj为由车载雾中j个计算资源共同处理的任务离开系统,x表示系统下一个状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594462.0/1.html,转载请声明来源钻瓜专利网。