[发明专利]超密集组网多业务切片资源分配方法及装置在审
| 申请号: | 202211487474.4 | 申请日: | 2022-11-25 |
| 公开(公告)号: | CN115996475A | 公开(公告)日: | 2023-04-21 |
| 发明(设计)人: | 张勇;滕颖蕾;柴玉昊;张震宇;袁思雨;白昊男 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | H04W72/541 | 分类号: | H04W72/541;H04W72/53;G06N3/092;G06N20/00 |
| 代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 薛海波 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 密集 组网 业务 切片 资源 分配 方法 装置 | ||
1.一种超密集组网多业务切片资源分配方法,其特征在于,所述超密集组网包括至少一个宏基站,每个宏基站还连接服务多个微基站;所述微基站的用户复用对应宏基站的切片资源,所述方法基于所述微基站与所述宏基站之间产生跨层干扰,以及相邻微基站之间产生同层干扰进行多业务切片资源分配;所述方法包括以下步骤:
获取多智能体强化学习模型,所述多智能体强化学习模型在每个微基站上均部署策略网络和价值网络;每个策略网络以对应单个微基站中各用户的传输速率以及总发射功率作为状态参数构建状态空间;获取用于表示各微基站中用户是否复用宏基站中资源块的关联参数,并以各微基站的关联参数集合和预测的其他各微基站的发射功率集合作为动作参数构建动作空间;每个微基站获取自身状态参数,根据所述策略网络选择相应的动作,每个微基站的价值网络根据相应微基站的状态参数和选择的动作以及其他微基站的状态参数和动作生成预估Q值,并用于对相应微基站的策略网络进行参数更新;以最大化奖励值为优化目标构建所述预估Q值与模型实际Q值的损失函数,对所述价值网络进行参数更新;直至到达预设性能要求;
其中,在状态更新过程中,所述宏基站根据跨层干扰价格和用户在微基站中复用资源块产生的跨层干扰构建宏基站收益计算式;所述微基站根据所述关联参数、资源块固定带宽长度、信号与干扰加噪声比、同层干扰价格、同层干扰、所述跨层干扰价格和跨层干扰构建微基站收益计算式;将所述宏基站作为领导者,将各微基站作为追随者构建非合作博弈;固定所述关联参数的值,采用逆向归纳法对所述微基站收益计算式进行求解,得到各微基站的发射功率均衡解,以用于更新每个策略网络的状态空间;将所述发射功率均衡解代入所述宏基站收益计算式,得到所述跨层干扰价格均衡解;
将各微基站的状态参数输入所述多智能体强化学习模型,生成相应的动作策略,实现多业务切片资源分配。
2.根据权利要求1所述的超密集组网多业务切片资源分配方法,其特征在于,所述宏基站根据跨层干扰价格和用户在微基站中复用资源块产生的跨层干扰构建宏基站收益计算式,所述宏基站收益计算式为:
其中,UMBS表示所述宏基站收益;UUE表示所有微基站的用户集合;UPRB表示资源块的总数;UBS表示所述宏基站和所有微基站的集合;表示用户i在微基站b使用资源块j的跨层干扰价格;表示用户i在微基站b使用资源块j造成的跨层干扰。
3.根据权利要求1所述的超密集组网多业务切片资源分配方法,其特征在于,所述微基站根据所述关联参数、资源块固定带宽长度、信号与干扰加噪声比、同层干扰价格、同层干扰、所述跨层干扰价格和跨层干扰构建微基站收益计算式,所述微基站收益计算式为:
s.t.
其中,Ub表示所述微基站收益;UUE,b表示微基站b的用户集合;Us表示切片的种类;表示用户i和切片s、资源块j、微基站b之间的关联关系;B表示资源块固定带宽长度;表示用户i在微基站b使用资源块j造成信号与干扰加噪声比;表示用户i在微基站b使用资源块j的同层干扰价格;表示用户i在微基站b使用资源块j造成的同层干扰;表示用户i在微基站b使用资源块j的跨层干扰价格;表示用户i在微基站b使用资源块j造成的跨层干扰;表示用户i在微基站b分配给资源块j的发射功率;UUE表示所有微基站的用户集合;UBS表示所述宏基站和所有微基站的集合;Imax表示干扰最大值;UPRB表示资源块的总数;τ表示资源块总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211487474.4/1.html,转载请声明来源钻瓜专利网。





