[发明专利]一种基于约束马尔可夫决策过程的高能效资源优化方法有效
申请号: | 201510698436.7 | 申请日: | 2015-10-22 |
公开(公告)号: | CN105407535B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 蒋雁翔;李鹏;郑福春;高西奇;尤肖虎 | 申请(专利权)人: | 东南大学 |
主分类号: | H04W72/04 | 分类号: | H04W72/04 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 黄成萍 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 约束 马尔可夫 决策 过程 能效 资源 优化 方法 | ||
本发明公开了一种大规模天线系统中基于约束马尔可夫决策过程的高能效资源优化方法,基于约束马尔可夫决策过程的建模;通过拉格朗日乘子法将原优化问题转化为无约束形式;利用改进值迭代算法得到最优资源配置策略。本发明解决了在大规模天线系统中,多小区场景中干扰严重(多变量耦合)的情况下资源优化求解困难的问题,所设计算法易实施、收敛快,可以在保证用户数据传输速率的服务质量前提下,有效提升大规模天线系统的能效。
技术领域
本发明涉及一种大规模天线系统中基于约束马尔可夫决策过程的高能效资源优化方法,属于移动通信系统中的资源分配技术。
背景技术
大规模天线技术以其高谱效、高能效的特点而成为未来移动通信中的关键技术。但是随着天线数量的增加,整体的天线固定功率消耗也会急剧增加,功率模型需要重建,同时,常规的波束赋型操作如迫零、最小均方误差等技术的计算复杂度会急剧上升,但幸运的是,大规模天线系统的特点使得最为简单的最大混合比波束赋型即可实现优良的性能,然而,最大混合比波束赋型却无法抑制用户间与小区间的干扰,进而造成能效表达式中的多变量耦合问题。
尽管大规模天线系统具有高能效的潜在优势,但是从绿色通信的角度而言,大规模天线系统中的高能效资源分配方法仍然是亟需的。在考虑了大规模天线系统中的诸多问题之后,本发明提供了一种高能效资源分配优化方法。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种大规模天线系统中基于约束马尔可夫决策过程的高能效资源优化方法,解决在多小区场景中干扰严重(多变量耦合)的情况下资源优化求解困难的问题,本发明方法易实施、收敛快,可以在保证用户数据传输速率的服务质量前提下,有效提升大规模天线系统的能效。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种大规模天线系统中基于约束马尔可夫决策过程的高能效资源优化方法,包括如下步骤:
(1)对无线通信场景建立基于约束马尔可夫决策过程的数学模型;
(2)初始化拉格朗日算子向量与回报效用函数;
(3)利用改进值迭代算法处理优化问题,获得最优资源配置策略。
所述步骤(1)中,建立基于约束马尔可夫决策过程的数学模型,具体包括如下步骤:
(11)设定信道增益的量化段数QS与用户发射功率的量化段数QA,并对信道增益和用户发射功率plk进行均匀量化,得到近似信道增益ψlikκ和近似用户发射功率alk,将近似信道增益ψlikκ称作无线通信场景中第l小区内的第k用户与第i小区内的第κ用户之间的状态,将近似用户发射功率alk称作无线通信场景中第l小区内的第k用户的行动;其中:gllk为第l小区内基站与第l小区内的第k用户之间的信道传输向量,为gllk的共轭转置形式,gliκ为第l小区内基站与第i小区内的第κ用户之间的信道传输向量,plk为配置给第l小区内的第k用户的发射功率;
(12)将近似信道增益ψlikκ的所有可能取值表述为状态集合sc,将近似用户发射功率alk的所有可能取值表述为动作集合ac;
(13)计算约束马尔可夫决策过程的状态转移概率矩阵P;
(14)设定回报效用函数与约束效用函数的折扣因子参数λ;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510698436.7/2.html,转载请声明来源钻瓜专利网。