[发明专利]一种针对边缘网络下突发请求的强化学习调度方法及设备有效
申请号: | 201911016176.5 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110662238B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 陈宁;张胜;钱柱中;陆桑璐 | 申请(专利权)人: | 南京大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;H04W28/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 边缘 网络 突发 请求 强化 学习 调度 方法 设备 | ||
1.一种针对边缘网络下突发请求的强化学习调度方法,其特征在于,包括以下步骤:
S1、建立系统模型,包括通信模型、请求模型和服务器模型;
S2、根据系统模型为调度突发请求建立目标函数,将调度突发请求转化为优化问题;
S3、采用强化学习求解优化问题,定义状态空间、动作空间和奖赏函数,建立强化学习模型;
S4、采用A3C算法训练强化学习模型直至收敛;
S5、将训练好的强化学习模型用于边缘网络的请求调度;
其中,所述步骤S1包括:
S1-1、建立通信模型:将网络链接分为上行链路和下行链路,假设带宽H被分成|K|个不同频率的子波,移动设备端和服务器端的传输能力分别为pu和ps,上行和下行链路有相同的噪声N0,上行和下行链路的信道衰弱系数分别为hul和hdl,上行和下行链路的目标误码率分别为gul和gdl,用户和基站之间的距离为d,当前可用的的频率子波数量为k,路径损失系数为βl,可得上行和下行链路的最大容量rul和rdl:
S1-2、建立请求模型:利用输入规模来衡量工作量,设请求Ri的输入大小为Bi,ω代表每字节需要的CPU周期数,则总工作量Wi=ωBi;
S1-3、建立服务器模型:根据边缘服务器资源受限,只能配置有限个服务的现实,使用指示变量来指示APj是否有服务mi,使用表示在APj为服务mi分配的核数,那么有:M代表所有的服务集合,Cj表示部署在APj上的服务器的总核数;
所述步骤S2根据请求的两阶段处理特征,建立目标函数,包括:
S2-1、第一阶段,移动设备选择一个最优的接入AP,并将请求发送到该AP上的服务器,以表示用户ui可以连接的AP集合:
其中φ(ui)表示用户ui可以直接连接的AP集合,指示APj是否为请求配置了相关服务;
用指示变量来指示是否选择了APj,那么:
其中表示用户ui在t时刻发布的请求的输入大小,即为上行数据规模,Wit表示请求的工作量,表示请求的上行传输时间,表示用户ui到APj的上行链路容量,表示请求的下行传输时间,为下行数据规模,表示APj到用户ui的下行链路容量,表示请求在APj的计算处理时间,表示APj的服务器为请求分配的核数,f表示每个核的处理能力,表示请求在APj的计算时间,表示APj的服务器上与同类的请求的等待队列,Wq表示等待队列中q的工作量;
S2-2、若请求的预测完成时间超过请求允许被完成的最晚时间,则进入第二阶段,将一定比例的工作量卸载到相邻服务器;
以表示与APi相邻且配置了相同服务的AP集合:
用l(j,k)表示APj和APk之间的传播时延,和表示分配到接入APj和邻居APk的比例,表示将任务量从APj重分配到APk的时延,那么:
其中均为APi和APj之间的传播时延,表示请求在APk的计算处理时间,表示请求在APk的等待时间;
S2-3、针对在时间T内到达的所有请求,要最大化按时完成的请求数量,同时满足服务器和网络的资源限制,得到如下优化问题Ω:
s.t.
其中表示请求允许被完成的最晚时间,U表示用户集合;
所述步骤S3将AP的选择、相邻服务器的选择、以及工作量的分配方案耦合成动作向量at,将网络状态、请求特征、服务器状态组合成状态向量st,通过时延和允许被完成的最晚时间定义其奖赏函数reward。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911016176.5/1.html,转载请声明来源钻瓜专利网。