[发明专利]基于计算迁移的云边协同控制系统及迁移决策生成方法在审
申请号: | 202110561206.1 | 申请日: | 2021-05-22 |
公开(公告)号: | CN113326002A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 胡伟;郭秋婷;苏雪源;马坤;刘文亮;陈行滨;林日晖;熊军 | 申请(专利权)人: | 清华大学;国网福建省电力有限公司厦门供电公司;国家电网有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算 迁移 协同 控制系统 决策 生成 方法 | ||
1.一种基于计算迁移的云边协同控制系统,包括:云端、由多个边缘节点构成的边缘计算中心以及多个终端;其中,所述云端与每个边缘节点之间、每个边缘节点与该节点聚集的各终端之间相互连接;其特征在于,所述云端用于从各边缘节点接收该节点的带宽和计算资源的分配情况的状态信息并储存,云端利用储存的当前状态信息及所有历史状态信息,通过云边协同深度强化学习算法生成当前时刻最优的迁移决策,并将该最优的迁移决策返回给边缘计算中心的各个边缘节点;其中,所述迁移决策包括各边缘节点执行各终端发送的计算任务的计算成本,边缘节点分配给各终端的带宽占比和计算资源占比,以及各终端是否选择边缘节点执行计算的指标值;
所述每个边缘节点用于接收该边缘节点聚集的各终端发来的计算任务请求;当收到计算任务请求时,边缘计算中心将当前各边缘节点的带宽和计算资源的分配情况的状态信息发送给云端,然后各边缘节点接收云端生成的最优的迁移决策并将该迁移决策发送给对应的终端;之后边缘节点接收其聚集的各终端按照对应的迁移决策上传的计算任务的数据,该边缘节点接收数据后进行计算,再将对应的计算结果发送回该终端;
所述终端用于进行电力系统各环节的数据采集并通过采集的数据判定是否需要执行计算任务;当终端中需要处理的计算任务数据超出本地的计算能力,该终端向对应的边缘节点发送计算请求,然后各终端接收对应的边缘节点发送的最优的迁移决策并按照该决策上传计算任务的数据,并从边缘节点接收计算的结果。
2.如权利要求1所述的系统,其特征在于,所述云端用于接收每个边缘节点上传的该节点聚集的各终端的自身状态参数,通过存储在云端的电力系统控制模型计算各边缘节点聚集的各终端参与电力系统控制的参数并将该参数发送给对应的边缘节点;每个边缘节点用于接收该边缘节点聚集的各终端发送的自身状态参数,该边缘节点将接收到的所有状态参数发送给云端;每个边缘节点辅助云端进行电力系统控制模型的计算,接收云端发出的该边缘节点聚集的各终端参与电力系统控制的参数,并将该参数发给对应的各终端;各终端用于向对应边缘节点上传自身的状态参数,并接收对应边缘节点发送的该终端参与电力系统控制的参数并执行。
3.一种基于权利要求1所述系统的迁移决策生成方法,其特征在于,该方法包括以下步骤:
1)记i表示第i个终端,其中i∈{1,2,…,N},N代表终端的总数;j表示第j个边缘节点,其中j∈{0,1,2,…,M},M代表边缘节点的总数;其中,当j=0时,其对应的边缘节点为终端本身;
各边缘节点对其聚集的各终端的信息进行同步更新,并对其聚集的每个终端建立一个对应的任务表:其中xij表示计算任务在本地执行还是被迁移的0-1变量,当xij=1时,计算任务需要被迁移,当xij=0时,计算任务在本地执行;λij表示边缘节点j分配给终端i的带宽占比,βij表示边缘节点j分配给终端i的计算资源占比;Ttoli表终端i的最大容许延迟;
由所有的任务表可以得到总任务集F:F={Fij|i∈{1,2,3,…,N},j∈{1,2,3,…,M}};
2)终端i的本地计算延迟为:其中fil表示终端i的算力;
因此终端i在本地计算时产生的能耗为:其中pil表示终端i的计算功率;
终端i的计算成本为:其中α和1-α分别表示时间成本和能耗成本的权重,α∈[0,1];
3)当终端i的本地计算任务计算时间大于最大容许延迟Ttoli,则通过迁移计算,由终端i对应的边缘节点j进行迁移计算;
用户端任务i迁移至边缘节点j上下行链路速率分别如下:
其中Bj表示边缘节点j的带宽;Piup表示终端i上传数据的传输功率;Hi表示终端i的无线信道的信道增益;N0表示噪声功率;gup目标误码率;d(i,j)表示终端i与边缘节点j之间的距离,ξ表示传输信道路径的损耗指数;
终端i的任务迁移到边缘节点j的执行过程总延迟为:
式中,分别代表终端i的任务迁移到边缘节点j的上传时间延迟,在节点j的计算时间以及将计算结果返回用户终端i的时间延迟;
终端i的任务迁移到边缘节点j的执行过程总能耗为:
式中,分别代表终端i的任务迁移到边缘节点j上传传输功率,在节点j的计算功率以及将计算结果返回终端i的传输功率;
最后得到终端i的任务迁移到边缘节点j的传输总成本为:
4)云端执行基于Actor-Critic算法的云边协同深度强化学习算法,得到最优的迁移策略;具体方法如下
定义:
状态空间:St=(Cij(t)) (5)
动作空间:At=(zij(t),λij(t),βij(t)) (6)
式中Cij(t)表示t时刻终端i的任务迁移至边缘节点j计算的总成本;λij(t)、βij(t)分别t时刻边缘节点j分配给终端i的带宽和计算资源占比;zij(t)表示t时刻终端i选择边缘节点j进行迁移;
定义奖励函数为:
其中v为奖励值;
定义策略函数为:π(st,at)=π(at|st;θ)
其中θ为使用策略迭代更新网络中的权重参数,关于奖励期望E[Rt]的策略梯度更新公式为:
其中,bt(st)为基线函数,基于价值函数的深度神经网络,损失函数定义为:
其中为权重参数,Target Q定义为:
式中,γ为衰减因子;
算法执行过程中,输入设置为:
记需要计算的任务数据大小为Di,i∈{1,2,…,N};用户终端i的最大容许延迟为带宽设置为Bj,j∈{1,2,…,M};计算能力表示为:
输出设置为:
优化得到的计算成本以及边缘节点分配给终端i的带宽占比边缘节点j分配给终端i的计算资源占比以及表示终端i是否选择边缘节点j执行计算的指标
算法具体步骤如下:
1初始化深度神经网络(DNN)权重指标θ,θ',ω,ω'以及每个边缘节点的最大迭代次数;
2设置t=1;
3设置t0=t;同步边缘节点中的参数:θ=θ',ω=ω';
4基于策略π(at|st;θ')选取动作at,记录奖励值rt以及由动作at执行得到的新的状态st+1,t=t+1;重复执行此步骤直到t-t0=T;
5设置h=t-1,通过式(8)优化奖励值;
6根据损失函数式(9)和目标Q值函数式(10)来计算Q值;
7根据计算得到的Q值,得到R=rh+γR;
8依据以下函数更新累计梯度:
9判断h是否与t0相等:如果不相等则返回步骤5;如果相等则进入步骤10;
10更新云端的深度神经网络DNN参数:θ=θ-ρ1dθ,ω=ω-ρ2dω;
11将更新后的DNN参数θ,ω传递给云端;
12判断是否所以边缘节点均已执行,如果没有执行完,则返回步骤3;如果所以边缘节点均已执行则进入步骤13;
13求解得到当前时刻最优的迁移策略,包括:以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;国网福建省电力有限公司厦门供电公司;国家电网有限公司,未经清华大学;国网福建省电力有限公司厦门供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110561206.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种调味蛋粒生产散装称重装置
- 下一篇:一种土壤污染检测治理自动化一体机