[发明专利]一种面向吞吐量的蜂窝网络D2D通信动态资源分配方法在审
| 申请号: | 202111140067.1 | 申请日: | 2021-09-28 |
| 公开(公告)号: | CN113891481A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 郑军;姜书瑞;张源 | 申请(专利权)人: | 东南大学 |
| 主分类号: | H04W72/08 | 分类号: | H04W72/08;H04W16/10;H04B17/382;H04W72/04 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 任志艳 |
| 地址: | 211189 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 吞吐量 蜂窝 网络 d2d 通信 动态 资源 分配 方法 | ||
1.一种面向吞吐量的蜂窝网络D2D通信动态资源分配方法,其特征在于,包括如下步骤:
步骤1,判断新到达用户的类型,用户类型包括蜂窝用户和D2D用户对;
步骤2,为新到达用户分配频谱资源块;具体包括如下步骤:
步骤2.1,根据用户类型,分别计算用户在各频谱资源块上的链路信干噪比和所能获得的吞吐量;
步骤2.2,将用户在各频谱资源块上所能获得的吞吐量从大到小排序;为新到达的蜂窝用户或D2D用户对分配当前能够提供最大用户吞吐量的频谱资源块;
对于蜂窝用户,若所能获得的吞吐量小于蜂窝用户的最小吞吐量要求,则拒绝该蜂窝用户接入网络;
步骤3,为新到达用户分配发送功率;
若新到达用户为蜂窝用户,则为其分配固定发送功率;
若新到达用户为D2D用户对,调用基于Q学习的功率控制算法为该D2D用户对分配发送功率,并动态调整共享同一频谱资源块的其他D2D用户对的发送功率,以最大化网络总吞吐量;当所有可供D2D用户对选择的功率均无法满足占用同一频谱资源块的蜂窝用户的最小吞吐量要求,则拒绝该D2D用户对接入网络。
2.根据权利要求1所述一种面向吞吐量的蜂窝网络D2D通信动态资源分配方法,其特征在于,步骤2.1中,根据用户类型,分别计算用户在各频谱资源块上的链路信干噪比和所能获得的吞吐量;具体为:
1),若新到达用户类型为蜂窝用户,蜂窝用户在各频谱资源块上的链路信干噪比和所能获得的吞吐量计算过程如下:
蜂窝用户在各频谱资源块上的链路信干噪比计算公式为:
其中,Ci表示第i个蜂窝用户(i=1,2,…),Dj表示第j个D2D用户对(j=1,2,…),r=1,2,…,K表示网络中频谱资源块的编号;表示共享第r个频谱资源块的所有D2D用户对的集合;表示占用第r个频谱资源块的蜂窝用户Ci的发送功率,表示占用第r个频谱资源块的D2D用户对Dj的发送功率;表示占用第r个频谱资源块的蜂窝用户Ci与基站之间的信道增益,表示占用第r个频谱资源块的D2D用户对Dj发送端与基站之间的信道增益,σ2表示噪声功率;
根据香农定理,蜂窝用户在各频谱资源块上所能获得的吞吐量计算公式为:
其中,W表示一个频谱资源块的带宽;
2),若新到达用户类型为D2D用户,D2D用户在各频谱资源块上的链路信干噪比和所能获得的吞吐量计算步骤如下:
D2D链路的信干噪比计算公式为:
其中,表示占用第r个频谱资源块的D2D用户对Dj发送端与接收端之间的信道增益,表示占用第r个频谱资源块的蜂窝用户Ci和D2D用户对Dj接收端之间的信道增益,表示共享第r个频谱资源块的不同D2D用户对Dj'发送端与Dj接收端之间的信道增益;
根据香农定理,D2D用户对的吞吐量计算公式为:
3.根据权利要求1所述一种面向吞吐量的蜂窝网络D2D通信动态资源分配方法,其特征在于,步骤3中,若新到达用户为D2D用户对,调用基于Q学习的功率控制算法为该D2D用户对分配发送功率,具体为,根据基于Q学习的功率控制算法所输出的Q值表为该D2D用户对分配发送功率。
4.根据权利要求1所述一种面向吞吐量的蜂窝网络D2D通信动态资源分配方法,其特征在于,步骤3中,若新到达用户为D2D用户对,调用基于Q学习的功率控制算法为该D2D用户对分配发送功率,并动态调整共享同一频谱资源块的其他D2D用户对的发送功率,以最大化网络总吞吐量;具体步骤为:
步骤3.1,对于共享新到达D2D用户对所分配的频谱资源块的Nr个D2D用户对Dj,j∈{1,2,…,Nr},初始化所有基于Q学习的功率控制算法输出的Q值表的值为0;将j赋值为1;
步骤3.2,选择共享该频谱资源块的第j个D2D用户对;
步骤3.3,基于当前Q值表,根据ε-greedy策略选择一个动作a;其中,动作a定义为为共享该频谱资源块的每个D2D用户对选择一个发送功率p∈{p1,p2,…,pL},其中,p1,p2,…,pL为可供选择的发送功率;具体地,产生一个0-1的随机数,若小于ε,则随机选择动作,若大于ε,则选择Q值最大的动作;
步骤3.4,执行动作a,计算奖励函数R;
奖励函数R定义如下:
其中,τ0表示占用该频谱资源块的蜂窝用户的最小吞吐量要求;
上式表示当蜂窝用户的吞吐量高于其最小吞吐量要求时,奖励函数为共享该频谱资源块的所有用户的总吞吐量,即算法的优化目标为最大化网络总吞吐量;否则,奖励函数为-1,表示惩罚值;
步骤3.5,根据以下公式更新Q值表:
其中,Q'(s,a)表示Q值表的更新值,Q(s,a)表示Q值表的当前值,α表示学习率,0≤α≤1,γ表示衰减因子,0≤γ≤1,表示当前Q值表中的最大值;
步骤3.6,重复步骤3.3-3.5直到Q值表收敛;
步骤3.7,重复步骤3.2-3.6直到遍历共享该频谱资源块的所有D2D用户对;
步骤3.8,重新将j赋值为1,重复步骤3.2-3.7直到共享该频谱资源块所有D2D用户对的Q值表均收敛至同一最优解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111140067.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的智能控制系统及运行方法
- 下一篇:一种兽药瓶检漏装置





