[发明专利]一种集能型无线中继网络吞吐量最大化方法有效
申请号: | 201810795748.3 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109104734B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 钱丽萍;冯安琪;冯旭;黄玉蘋;黄亮;吴远 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;H04W52/26;H04W52/46;H04W72/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法,包括以下步骤:1)集能型无线中继网络中通过可再生能量优化管理实现最大吞吐量,其中,优化问题描述为一个多变量优化问题;2)将问题P1分解为两部分优化:功率子优化和时隙子优化,即深度确定性策略梯度方法优化变量p |
||
搜索关键词: | 一种 集能型 无线 中继 网络 吞吐量 最大化 方法 | ||
【主权项】:
1.一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法,其特征在于:所述方法包括以下步骤:1)集能型无线中继网络中通过可再生能量优化管理实现最大吞吐量,其中,优化问题描述为一个多变量优化问题:P1:
受限于:
(约束条件1)
(约束条件2)
(约束条件3)
(约束条件4)
(约束条件5)
在此,问题P1的各参数定义如下:pi:中继节点在时隙i的传输功率;ri:中继节点在时隙i的数据率;τi:源节点在时隙i的传输时间;
中继节点在时隙i的传输时间;ui:源节点在时隙i的数据率;hi:中继节点到目的节点的信道增益;Ei:中继节点在时隙i时所采集的能量;Emax:中继节点的电池最大容量;Qmax:中继节点的数据缓存容量;L:单个时隙长度;T:传输时隙数;W:网络带宽;2)将问题P1分解为两部分优化:功率子优化和时隙子优化,即通过优化变量pi和
来得到最优的ri,其中,通过深度确定性策略梯度方法来优化中继节点在各时隙i上的传输功率pi和传输时间
从而最终决定问题P1中各时隙i的数据率ri之和的最大化;该深度确定性策略梯度方法由执行单元,评分单元和环境所组成,所有的传输功率pi和传输时间
都被编进了执行单元所需的状态xt,执行单元在当前状态下采取动作a对传输功率pi和传输时间
进行更改并进入下一个状态xt+1,同时得到环境返回的奖励r(xt,a),评分单元结合状态xt,动作a以及环境返回的奖励r(xt,a)给执行单元打分,即表明执行单元在状态xt下采取动作a是好是坏;执行单元的目标就是让评分单元所打的分越高越好,而评分单元的目标是让自己每次打出的分都接近真实,这可以通过奖励r(xt,a)来调节;在执行单元,评分单元和环境不断交互更新下,传输功率pi和传输时间
将不断被优化直到被更新到最优,评分单元的更新方式为:S(xt,a)=r(xt,a)+γS′(xt+1,a′) (3)其中,各参数定义如下:xt:在时刻t,系统所处状态;xt+1:在时刻t+1,系统所处状态;a:在当前状态执行单元所采取的动作;a′:在下一状态执行单元所采取的动作;S(xt,a):执行单元中的评估网络在状态xt下采取动作a所得到的分值;S′(xt+1,a′):执行单元中的目标网络在状态xt+1下采取动作a′所得到的分值;r(xt,a):在状态xt下采取动作a所得到的奖励;γ:奖励衰减比重;3)所有的传输功率pi和传输时间
作为深度确定性策略梯度方法的状态xt,动作a则是对状态xt的更改,更改后系统在各时隙i的数据率ri之和会与一个设定的标准值进行比较,如果比这个标准值大则使当前奖励r(xt,a)设为正值,反之设为负值,同时系统进入下一状态xt+1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810795748.3/,转载请声明来源钻瓜专利网。