[发明专利]认知无线电中基于协作学习的多用户动态频谱接入方法无效

专利信息
申请号: 201110200425.3 申请日: 2011-07-18
公开(公告)号: CN102238555A 公开(公告)日: 2011-11-09
发明(设计)人: 朱琦;朱洪波;杨龙祥;李晓静 申请(专利权)人: 南京邮电大学
主分类号: H04W16/10 分类号: H04W16/10;H04W16/14
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 叶连生
地址: 210003 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明的目的在于提供一种认知无线电系统中基于协作学习的多用户动态频谱接入方法,该方法将黑板模型、融合算法以及强化学习方法结合起来,先对各个状态-动作对函数值用Boltzmann机进行非线性化,再采用轮盘赌算法进行动作选择,然后确定奖赏函数,实现黑板模型,即所有认知用户将各自当前的Q值通过公共控制信道发送到黑板,并且可以从黑板中获取其它认知用户的Q值,然后利用融合算法进行计算,在此基础上,每个认知用户都根据融合后的Q值进行动作选择。本发明中的每个认知用户独立执行强化学习算法,同时它们之间进行相互合作,共享状态、策略和奖赏,从而加快学习速度。
搜索关键词: 认知 无线电 基于 协作 学习 多用户 动态 频谱 接入 方法
【主权项】:
1.一种认知无线电系统中基于协作学习的多用户动态频谱接入方法,其特征在于该方法的具体内容为:a、初始化:随机初始化每个认知用户的状态-动作对函数值Q(s,a),s表示认知用户的状态,a表示认知用户所采取的动作,设定初始学习速率α0、温度参数T和迭代次数N;b、状态空间的构建:状态空间S={s1,s2,···,sK,sd1,sd2,···,sdM},]]>其中sk=0表示信道被授权用户k占用;sk=1表示信道未被占用;s1~sK表示授权用户占用的信道,K为授权用户数,表示被认知用户占用的信道,d1~dM表示M个认知用户数;c、动作选择策略:对状态-动作函数值Q(st,at)用玻耳兹曼法进行非线性化,然后再采用轮盘赌算法进行选择,用Boltzmann机分布选择动作的概率p(ai/st,Q)=eQ(st,ai)/TΣajAeQ(st,aj)/T,]]>其中,Q(st,ai)是每个状态-动作对的函数值,A为认知用户作用于环境的动作集合,p(ai/st,Q)表示在状态st选择动作ai的概率,i和j为动作的序号,T为可调节的温度参数,T的大小代表了随机性的大小,T越大则选择动作的随机性越强;d、确定奖赏函数:系统中存在一个信道同时被两个用户占用即冲突时,奖赏函数r为“-6”,是一种惩罚;不存在即没有冲突时r为“2”,反映了降低冲突概率的要求。e、实现黑板模型:在迭代了N次以后,所有认知用户将各自当前的Q值通过公共控制信道发送到黑板即控制中心,并且可以从黑板中获取其它认知用户的Q值,然后利用融合方法进行计算,在此基础上,每个认知用户都根据融合后的Q值进行动作选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110200425.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top