[发明专利]一种定向自组织网络的邻居发现方法有效
申请号: | 202110084025.4 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112929931B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 杨凯;高建银;眭畅豪;周荣花 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04W36/00 | 分类号: | H04W36/00;H04W48/16;H04W84/18 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 定向 组织网络 邻居 发现 方法 | ||
1.一种定向自组织网络的邻居发现方法,其特征在于,包括以下步骤:
步骤1:定义相关集合;
定义网络中每一个节点的状态集合S:
S={T,R} (1)
其中,所述的节点状态为节点的工作模式,在某一时刻,节点只能处于发送模式或者接收模式中的一种,T表示发送模式,R表示接收模式;
定义网络中每一个节点的动作集合A:
A={1,2,3,…,k} (2)
其中,所述动作为节点在时隙t需要执行的动作,为节点配置的波束切换定向天线的波束方向;波束切换定向天线包括k个预定义的波束方向,节点在时隙t能够选择的动作数为k;
步骤2:每个节点初始化各自的值函数表,初始值为0,值函数表的大小为2×k;
步骤3:每个节点选择各自的初始状态;各节点选择发送模式或接收模式的概率相同,均为p;
步骤4:每个节点基于UCB策略,从动作集合中选择在当前时隙需要执行的动作,其中,动作集合为步骤1所述的定向天线预定义的k个波束方向;
所述UCB策略为Q-Learning学习算法的行为策略,指导节点在时隙t的动作选择,在进行动作选择时,需要探索新的“状态-动作”对;使用UCB策略对非贪婪动作成为最优动作的可能性进行度量,选择最有可能成为最优动作的行为;
UCB策略指导动作选择公式如下:
其中,st表示在时隙t节点所处的状态,a表示节点处于状态st时能够选择的动作集,at表示从动作集a中选择的动作,c表示控制探索非贪婪动作的度;Q(st,a)表示动作集中每一个动作的价值所组成的集合,Nt(st,a)表示到时隙t为止动作集中每一个动作被选择的次数组成的集合;
步骤5:每个节点执行步骤4选择的动作,将定向天线波束切换到选择的方向;
步骤6:判断每个节点与环境交互时是否发生碰撞,若节点接收到2个以上的数据包,则认为发生了碰撞,给与奖励m1,提高节点在之后的时隙切换到该波束的概率;若节点成功发现1个邻居或时隙空闲,应该给与惩罚m2,鼓励节点探索其他波束方向;节点得到的回报r(st,αt)由公式(4)给出:
步骤7:每一个节点随机选择下一个时隙状态st+1;
步骤8:根据步骤6得到的回报r(st,αt),以及步骤7选择的下一个时隙状态st+1,更新值函数表:
其中,Q(st,at)表示状态为st动作为at时的价值,α表示学习率,γ表示衰减因子,a′表示节点处于状态st+1时能够选择的动作集,r(st,αt)表示节点与环境交互获得的回报,Q(st+1,a′)表示动作集中每一个动作的价值所组成的集合;
步骤9:判断节点是否发现所有邻居;如果定向自组织网络中所有节点都成功发现各自的全部邻居,则执行步骤10;否则,执行步骤11;
步骤10:记录邻居发现所需的时隙数,邻居发现过程结束;
步骤11:判断是否超出预定义的最大时隙数tslot;若超出,则邻居发现过程结束;若未超出,则节点进入下一个时隙,将步骤7得到的st+1赋值给st,转到步骤4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084025.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新型环保节能玻璃幕墙及其安装方法
- 下一篇:一种空压式熔融沉积型3D打印喷头