[发明专利]一种分布式认知无线传感器网络中基于Q学习的频谱分配方法在审
申请号: | 201610772003.6 | 申请日: | 2016-08-30 |
公开(公告)号: | CN106358203A | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 曾凡仔;刘翰山 | 申请(专利权)人: | 湖南大学 |
主分类号: | H04W16/14 | 分类号: | H04W16/14;H04W84/18;H04L27/00 |
代理公司: | 长沙市融智专利事务所43114 | 代理人: | 龚燕妮 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分布式认知无线传感器网络中基于Q学习的频谱分配方法,以最大化分布式认知无线传感器网络的平均吞吐量和平均能量效率比为目标,认知无线传感器网络中各节点针对周围授权频谱状态变化以及其他节点分配策略相互学习并最终适应,将该过程映射成分布式多智能体Q学习的过程,并通过执行时序轮替机制下的最佳响应Q学习迭代算法来逼近最佳频谱分配策略。本发明具有收敛速度快、计算复杂度低、改善认知无线传感器网络平均吞吐量和平均能量效率比的特点。 | ||
搜索关键词: | 一种 分布式 认知 无线 传感器 网络 基于 学习 频谱 分配 方法 | ||
【主权项】:
一种分布式认知无线传感器网络中基于Q学习的频谱分配方法,其特征在于,以网络平均吞吐量或网络平均能量效率比作为目标函数,以认知传感器节点作为智能体,以联合频谱状态S(t)=[s1(t),...,sj(t),...,sM(t)]作为Q学习的环境状态集合S,任一时隙内认知传感器节点频谱的分配动作A(t)作为智能体Agent的动作集合A,以认知传感器节点与授权频谱和其他节点之间的对应关系作为智能体的瞬时反馈奖励函数,采用时序轮替机制下的最佳响应Q学习迭代算法对网络中各节点频谱进行分配,在迭代过程中设定探索利用率为et;其中,sj(t)∈{0,1},sj(t)=1表示授权频谱Cj在时隙t处于占用状态,M表示授权频谱数量;sj(t)=0则表示授权频谱Cj在时隙t处于空闲状态。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610772003.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种云服务资源开销优化方法
- 下一篇:基于VOIP的交互方法及其系统