首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于多智能体强化学习的分布式动态频谱接入方法在审

申请号：	202111339165.8	申请日：	2021-11-12
公开（公告）号：	CN113923794A	公开（公告）日：	2022-01-11
发明（设计）人：	周力;谭翔;魏急波;赵海涛;熊俊;高文颖;唐麒;张姣;曹阔;刘潇然	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	H04W74/08	分类号：	H04W74/08;H04W24/08;G06K9/62;G06N3/08
代理公司：	长沙国科天河知识产权代理有限公司 43225	代理人：	邱轶
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于智能强化学习分布式动态频谱接入方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，包括以下步骤：

将多用户分布式动态频谱接入问题建模成多智能体马尔科夫合作博弈模型，并构建集中式训练、分布式执行的多智能体强化学习框架；所述多智能体强化学习框架包括离线训练模块和在线执行模块；

根据认知用户自身的窄带感知能力，获取局部频谱占用信息；

根据所述局部频谱占用信息，通过训练好的在线执行模块，利用学习到的接入策略进行认知用户的频谱接入；

实时监测认知用户的接入成功率，当成功率低于阈值时，离线训练模块对在线执行模块进行重新训练，以自主适应各种通信环境。

2.如权利要求1所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，所述离线训练模块包括集中训练器，所述集中训练器通过网络边缘计算服务器进行构建；

所述在线执行模块包括策略网络，所述策略网络加载在认知用户端。

3.如权利要求2所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，所述离线训练模块通过公共信道收集认知用户与无线环境的交互信息，利用收集到的交互信息给每个认知用户训练一个相互协作的策略网络，并将训练好的策略网络参数通过公共信道发送给对应的认知用户以更新对应认知用户端策略网络的参数。

4.如权利要求1所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，实时监测认知用户的接入成功率，包括：

根据认知用户的频谱接入情况，利用多智能体强化学习框架输出当次频谱接入的奖励值；

根据所述奖励值实时监测认知用户的接入成功率。

5.如权利要求4所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，根据认知用户的频谱接入情况，利用多智能体强化学习框架输出当次频谱接入的奖励值，包括：

将所有认知用户的接入成功次数相加作为每个认知用户的效用函数；

根据所述效用函数在多智能体强化学习框架内建立奖励函数；

根据认知用户的频谱接入情况，利用所述奖励函数输出当次频谱接入的奖励值。

6.如权利要求5所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，所述奖励函数为：

式中，表示t时刻所有认知用户的效用函数；表示t时刻认知用户n的接入成功次数；oⁿ表示t时刻认知用户n的观测；aⁿ表示t时刻认知用户n的接入动作；N表示认知用户的总数。

7.如权利要求2所述的基于多智能体强化学习的分布式动态频谱接入方法，其特征在于，所述策略网络为深度循环神经网络结构。

8.一种基于多智能体强化学习的分布式动态频谱接入系统，其特征在于，包括：

算法构建模块，用于将多用户分布式动态频谱接入问题建模成多智能体马尔科夫合作博弈模型，并构建集中式训练、分布式执行的多智能体强化学习框架；所述多智能体强化学习框架包括离线训练模块和在线执行模块；

频谱感知模块，用于根据认知用户自身的窄带感知能力，获取局部频谱占用信息；

频谱接入模块，用于根据所述局部频谱占用信息，通过训练好的在线执行模块，利用学习到的接入策略进行认知用户的频谱接入；

实时监测模块，用于实时监测认知用户的接入成功率，当成功率低于阈值时，离线训练模块对在线执行模块进行重新训练，以自主适应各种通信环境。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1～7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1～7中任一项所述方法的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111339165.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种淀粉改性方法及应用
下一篇：多媒体资源的模型训练及相似度确定方法和装置

同类专利

专利分类

H04 电通信技术
H04W 无线通信网络
H04W74-00 无线信道接入，例如，调度接入或随机接入
H04W74-02 .混合接入技术
H04W74-04 .调度接入
H04W74-08 .非调度接入，例如，随机接入，ALOHA或CSMA[载波检测多路接入]
H04W74-06 ..使用轮询

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top