[发明专利]一种超密集网络中的强化学习的资源分配方法在审

申请号：	201510409462.3	申请日：	2015-07-14
公开（公告）号：	CN106358308A	公开（公告）日：	2017-01-25
发明（设计）人：	张海君;王文韬;孙梦颖;郝匀琴;周平;阳欣豪	申请（专利权）人：	北京化工大学
主分类号：	H04W72/12	分类号：	H04W72/12;H04W52/24;H04W84/18
代理公司：	暂无信息	代理人：	暂无信息
地址：	100029 北京市朝阳区北三***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种超密集网络中的强化学习的资源分配方法。本发明实施涉及5G移动通信中超密集网络领域，提供了一种密集部署网络中家庭基站与宏基站、家庭基站与家庭基站、家庭基站与移动用户之间资源分配的方法。本方法通过功率控制实现，将每个毫微微小区看成一个智能体，联合调整家庭基站的发射功率，避免密集部署的家庭基站以最大功率发送对宏基站、相邻基站构成的严重干扰，最大化系统吞吐量。考虑用户的时延QoS,用可对用户的时延提供保障的“有效容量”代替传统的“香农容量”。采用超模博弈模型，这样使整个网络功率分配达到纳什均衡。使用了Q-Learning的强化学习方法，使家庭基站的具备了学习功能，从而能实现最优的功率分配。应用本发明，在满足用户时延的前提下可有效的提升超密集网络的系统容量。
搜索关键词：	一种密集网络中的强化学习资源分配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种超密集网络中的强化学习的资源分配方法，其特征在于包括以下步骤：步骤1：初始化学习因子,对于每个状态s以及每个动作a,初始化评价函数,传输策略，猜想，正标量；步骤2：初始化家庭基站状态s，发射功率P、信干比等；步骤3：根据传输策略，选定当前过程的动作；步骤4：根据目标接收者的反馈信息检测当前的信干比，通过识别当前传输功率级别和比较当前信干比是否大于门限来确定下一时刻状态；步骤5：如果家庭用户当前的信干噪比大于阈值，通过回报函数计算回报（回报，即效能函数），否则，将回报置零；步骤6: 对步骤四中得到的回报值求期望，利用基于猜想Q的更新公式，得到新的Q值，更新评价函数；步骤7：根据步骤五中得到的Q值，根据贪婪策略，更新用户的策略；步骤8：利用猜想更新公式，得到其他家庭基站下一时刻行为的猜想，使用户进入下一个状态，转入步骤二；步骤9：终止此次学习过程，每个家庭基站的无线资源分配完成，准备下一次资源调度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京化工大学，未经北京化工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510409462.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04W 无线通信网络
H04W72-00 本地资源管理，例如，无线资源的选择或分配或无线业务量调度
H04W72-02 .通过用户或终端选择无线资源
H04W72-04 .无线资源分配
H04W72-12 .无线业务量调度
H04W72-14 ..使用授权的信道
H04W72-06 ..基于无线资源的等级标准

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种超密集网络中的强化学习的资源分配方法在审

专利文献下载