[发明专利]一种超密集网络中的强化学习的资源分配方法在审

专利信息
申请号: 201510409462.3 申请日: 2015-07-14
公开(公告)号: CN106358308A 公开(公告)日: 2017-01-25
发明(设计)人: 张海君;王文韬;孙梦颖;郝匀琴;周平;阳欣豪 申请(专利权)人: 北京化工大学
主分类号: H04W72/12 分类号: H04W72/12;H04W52/24;H04W84/18
代理公司: 暂无信息 代理人: 暂无信息
地址: 100029 北京市朝阳区北三*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种超密集网络中的强化学习的资源分配方法。本发明实施涉及5G移动通信中超密集网络领域,提供了一种密集部署网络中家庭基站与宏基站、家庭基站与家庭基站、家庭基站与移动用户之间资源分配的方法。本方法通过功率控制实现,将每个毫微微小区看成一个智能体,联合调整家庭基站的发射功率,避免密集部署的家庭基站以最大功率发送对宏基站、相邻基站构成的严重干扰,最大化系统吞吐量。考虑用户的时延QoS,用可对用户的时延提供保障的“有效容量”代替传统的“香农容量”。采用超模博弈模型,这样使整个网络功率分配达到纳什均衡。使用了Q-Learning的强化学习方法,使家庭基站的具备了学习功能,从而能实现最优的功率分配。应用本发明,在满足用户时延的前提下可有效的提升超密集网络的系统容量。
搜索关键词: 一种 密集 网络 中的 强化 学习 资源 分配 方法
【主权项】:
一种超密集网络中的强化学习的资源分配方法,其特征在于包括以下步骤:步骤1:初始化学习因子,对于每个状态s以及每个动作a,初始化评价函数,传输策略,猜想,正标量;步骤2:初始化家庭基站状态s,发射功率P、信干比等;步骤3:根据传输策略,选定当前过程的动作;步骤4:根据目标接收者的反馈信息检测当前的信干比,通过识别当前传输功率级别和比较当前信干比是否大于门限来确定下一时刻状态;步骤5:如果家庭用户当前的信干噪比大于阈值,通过回报函数计算回报(回报,即效能函数),否则,将回报置零;步骤6: 对步骤四中得到的回报值求期望,利用基于猜想Q的更新公式,得到新的Q值,更新评价函数;步骤7:根据步骤五中得到的Q值,根据贪婪策略,更新用户的策略;步骤8:利用猜想更新公式,得到其他家庭基站下一时刻行为的猜想,使用户进入下一个状态,转入步骤二;步骤9:终止此次学习过程,每个家庭基站的无线资源分配完成,准备下一次资源调度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510409462.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top