[发明专利]一种非授权频谱智能接入方法有效
申请号: | 202110578657.6 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113316174B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 裴二荣;黄一格;宋珈锐;陶凯;徐成义 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;H04B17/309;H04B17/382 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 授权 频谱 智能 接入 方法 | ||
1.一种非授权频谱智能接入方法,其特征在于:该方法包括以下步骤:
S1:初始化环境参数和智能体参数:环境由共存的WiFi接入点构成,故环境参数包括WiFi接入点的退避参数以及提出的接入框架的时间参数;具体而言,需要设置的退避参数包括初始窗口大小CW,WiFi接入点包长TW和最大退避阶数m,需要设置的时间参数包括βE、βSF和βS,智能体参数主要包括接入策略更新要用到的训练参数;
S2:初始化环境状态st=s1和经验回放机制RB:状态st被定义为:
其中ft为时刻t时共存网络的公平性指数,ft被定义为:
其中K表示共存网络中WiFi接入点的数目,和分别表示时刻t∈(t-TF,t]中第i个WiFi接入点和LTE小基站智能体的吞吐量,分别定义为:
式中,TF表示反馈周期的长度,TW和TL分别表示WiFi接入点和LTE小基站在当前反馈周期传输的包长或帧长,故吞吐量含义为在反馈周期TF中成功发送的包长或帧长所占据TF的比例;故初始状态基于当时共存网络具体的吞吐量和公平性计算得到;此外,LTE小基站包含一个经验回放机制RB,用于存储过往的经验以便样本接入策略的提升;
S3:LTE小基站选择动作:LTE小基站根据当前状态选择接入动作,而动作选择的策略需要权衡对与环境的探索和已有知识的利用,ε-贪心策略能很好地满足上述要求,其表达式定义为:
式中,ε∈[0,1]称为控制参数,其大小表明了LTE小基站在动作选择上的偏好;表示该等式表明以概率1-ε选择令当前Q值最大的动作,或者以概率ε随机从动作集合A中选择动作;接入动作at定义为:
at=[ATt,TXt]
式中,ATt∈{0,TSF,2TSF,…,NTSF}表示接入时刻,为LTE小基站基本传输单位子帧TSF的整数倍;TXt∈{TSF,2TSF,…,MTSF}表示接入后的传输时长,为LTE小基站基本传输单位子帧TSF的整数倍;智能体需要学习到一个控制策略,该策略可以知道智能体在当前状态下何时接入以及接入后传输持续时间;
S4:LTE小基站执行动作:根据所提非授权频谱接入框架,在后续βE个执行周期中执行动作at,收到环境反馈的奖励rt并更新状态至st+1;奖励值rt的定义为:
式中,共存网络总吞吐量被定义为:
S5:将转移样本et=(st,at,rt,st+1)存储到经验回访机制RB;
S6:接入策略更新:由于Q-网络用于近似动作价值函数Q(st,at;θ)≈Q(st,at),故LTE小基站接入策略的更新相当于Q-网络权重θ的更新;具体而言,LTE小基站从RB中随机抽取批量为H的样本,对损失函数采用梯度下降法更新Q-网络权重;对于每一个经验样本,该过程表达式为:
式中,yj表示目标值,由目标Q-网络Q′(·)参与计算得到,其定义为:
S7:训练终止,输出最优接入策略;此策略由Q-网络表示:
该式表示由Q-网络输入为信道状态st,则可以由输出端得到最优接入动作
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110578657.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用程序关联方法及装置
- 下一篇:显示面板及显示装置