[发明专利]认知无线电中基于协作学习的多用户动态频谱接入方法无效
申请号: | 201110200425.3 | 申请日: | 2011-07-18 |
公开(公告)号: | CN102238555A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | 朱琦;朱洪波;杨龙祥;李晓静 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04W16/10 | 分类号: | H04W16/10;H04W16/14 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的在于提供一种认知无线电系统中基于协作学习的多用户动态频谱接入方法,该方法将黑板模型、融合算法以及强化学习方法结合起来,先对各个状态-动作对函数值用Boltzmann机进行非线性化,再采用轮盘赌算法进行动作选择,然后确定奖赏函数,实现黑板模型,即所有认知用户将各自当前的Q值通过公共控制信道发送到黑板,并且可以从黑板中获取其它认知用户的Q值,然后利用融合算法进行计算,在此基础上,每个认知用户都根据融合后的Q值进行动作选择。本发明中的每个认知用户独立执行强化学习算法,同时它们之间进行相互合作,共享状态、策略和奖赏,从而加快学习速度。 | ||
搜索关键词: | 认知 无线电 基于 协作 学习 多用户 动态 频谱 接入 方法 | ||
【主权项】:
1.一种认知无线电系统中基于协作学习的多用户动态频谱接入方法,其特征在于该方法的具体内容为:a、初始化:随机初始化每个认知用户的状态-动作对函数值Q(s,a),s表示认知用户的状态,a表示认知用户所采取的动作,设定初始学习速率α0、温度参数T和迭代次数N;b、状态空间的构建:状态空间S = { s 1 , s 2 , · · · , s K , s d 1 , s d 2 , · · · , s d M } , ]]> 其中sk=0表示信道被授权用户k占用;sk=1表示信道未被占用;s1~sK表示授权用户占用的信道,K为授权用户数,
表示被认知用户占用的信道,d1~dM表示M个认知用户数;c、动作选择策略:对状态-动作函数值Q(st,at)用玻耳兹曼法进行非线性化,然后再采用轮盘赌算法进行选择,用Boltzmann机分布选择动作的概率p ( a i / s t , Q ) = e Q ( s t , a i ) / T Σ a j ∈ A e Q ( s t , a j ) / T , ]]> 其中,Q(st,ai)是每个状态-动作对的函数值,A为认知用户作用于环境的动作集合,p(ai/st,Q)表示在状态st选择动作ai的概率,i和j为动作的序号,T为可调节的温度参数,T的大小代表了随机性的大小,T越大则选择动作的随机性越强;d、确定奖赏函数:系统中存在一个信道同时被两个用户占用即冲突时,奖赏函数r为“-6”,是一种惩罚;不存在即没有冲突时r为“2”,反映了降低冲突概率的要求。e、实现黑板模型:在迭代了N次以后,所有认知用户将各自当前的Q值通过公共控制信道发送到黑板即控制中心,并且可以从黑板中获取其它认知用户的Q值,然后利用融合方法进行计算,在此基础上,每个认知用户都根据融合后的Q值进行动作选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110200425.3/,转载请声明来源钻瓜专利网。
- 上一篇:蒸球起盖器
- 下一篇:整体焊接式双辐板轮辋