[发明专利]基于强化学习的机器类通信设备接入蜂窝数据网络的方法有效
申请号: | 202110550199.5 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113473419B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 傅友华;雍鹏程 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04W4/70 | 分类号: | H04W4/70;H04W72/0446;H04W72/53;H04W74/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 刘莎 |
地址: | 210003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 机器 通信 设备 接入 蜂窝 数据 网络 方法 | ||
1.基于强化学习的机器类通信设备接入蜂窝数据网络的方法,其特征在于,基站对每个机器类通信设备进行调度,在设备需要发送数据时分配上行链路资源,在设备空闲时不分配资源;该方法的具体步骤如下:
步骤1,基站预测即将需要传输数据的设备,构成活跃设备集合;
步骤2,基站使用改进的上置信界算法在活跃设备集合中进行设备选择,并对所选择的设备分配上行链路资源;
步骤3,对基站选择的每个设备进行参数更新以及奖励的分配,进入下一时隙,返回步骤1;
步骤2具体为:
步骤2.1,活跃设备集合是否为空,若是则进入下一时隙,否则进入步骤2.2;
步骤2.2,活跃设备集合中是否存在0次传输成功的设备,若是则基站对该类设备分配上行链路资源,进入步骤2.3,否则进入步骤2.4;
步骤2.3,若上行链路资源被完全分配,则进入步骤2.5;若上行链路资源未完全分配且m<l,则进入步骤2.4;其中,m为0次传输成功且被分配上行链路资源的设备数量,l为采用MAB方法选择的最高UCB值对应的臂的数量;
步骤2.4,基站选择l-m个最大UCB值对应的设备进行上行链路资源分配,进入步骤2.5;
步骤2.5,对基站选择的每个设备,若Ci,t≥ρ且则按照如下规则更新:
ri,t←ri,t+Ui,t,
ni,t←ni,t+1,
n’i,t←n’i,t+1,
t′←t′+1;
若Ci,t<ρ或则按照如下规则更新:
ri,t←ri,t,
ni,t←ni,t,
t′←t′,
n’i,t←n’i,t+1;
更新完成后,进入下一时隙;其中,ri,t为时刻t之前设备i已获得的奖励,Ui,t为时刻t设备i的效用函数,ni,t为时刻t之前设备i已成功完成数据传输的次数,ni,t’为时刻t之前设备i已被分配上行链路资源的次数,t'为时刻t之前所有设备已成功完成数据传输的次数,Ci,t为时刻t设备i的数据传输速率,ρ为数据传输所需的最小速度,为时刻t设备i的最大允许接入延迟,ts为设备i在队列中准备传输数据的时刻,时刻t为当前时隙的开始时刻;
其中W为传输信道的带宽,qi,t为时刻t设备i的发射功率,hi,t为时刻t基站和设备i之间的信道,N0为噪声的功率谱密度;
步骤2.4中若0<ni,t≤Th,被选择的设备编号若Th<ni,t,被选择的设备编号其中Pi,t为时刻t基站预测设备i需要传输数据的概率,为时刻t的活跃设备集合,Pa为设备i的历史平均需要传输数据的概率,Th为设定阈值,λ、μ、为参数。
2.根据权利要求1所述的基于强化学习的机器类通信设备接入蜂窝数据网络的方法,其特征在于,步骤1中基站使用源流量预测算法预测即将需要传输数据的设备。
3.根据权利要求1所述的基于强化学习的机器类通信设备接入蜂窝数据网络的方法,其特征在于,hi,t=ai,t·gi,t,其中为小尺度瑞利衰落,不同时刻相互独立;PLdB为路径损耗,Xσ为方差为σ的对数正态阴影衰落。
4.根据权利要求1所述的基于强化学习的机器类通信设备接入蜂窝数据网络的方法,其特征在于,其中α+β+γ=1,vi,t为时刻t设备i的信息价值,为Ci,t的归一化值,a、b、c为参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110550199.5/1.html,转载请声明来源钻瓜专利网。