首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于深度强化学习的水下联合中继选择和功率分配方法有效

申请号：	202010694039.3	申请日：	2020-07-17
公开（公告）号：	CN111885671B	公开（公告）日：	2022-04-15
发明（设计）人：	韩松;李荦;李鑫滨;赵海红	申请（专利权）人：	燕山大学
主分类号：	H04W40/22	分类号：	H04W40/22;H04W40/12;H04W52/24;H04W52/26;H04W72/04;H04W72/08;H04B11/00;H04B13/02
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	姜玉蓉;李洪福
地址：	066004 河北省***	国省代码：	河北;13
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度强化学习水下联合中继选择功率分配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度强化学习的水下联合中继选择和功率分配方法，其特征在于，所述方法包括：

创建拓扑结构，包括一个源节点u、N个候选中继节点r₁,r₂···r_N和一个目的节点d；

广播信号给候选中继节点和目的节点，同时源节点根据状态信息进行中继选择和功率分配；

选中的中继节点转发信号给目的节点；

所述目的节点将状态信息反馈给源节点；

采用深度强化学习方法，使所述源节点不断与环境进行交互得到所需状态信息，通过策略优化离线学习的方式，使所述源节点在试错中学习到经验用于决策，包括：

源节点获取环境状态信息

源节点根据获得的状态信息输入神经网络，做出采取的决策行动a，作用于环境；

源节点选择的动作作用于环境后，环境把整个拓扑的信干噪比作为奖赏r反馈给源节点，同时环境从当前时刻状态s转移到下一时刻的状态s’，把(s,a,r,s’)放入内存D中；

使用RNN网络训练网络参数，包括：

步骤一，初始化回放内存记为D；

步骤二，使用循环神经网络RNN来拟合状态行动值函数Q，并随机初始化参数θ；

步骤三，使用RNN网络来拟合目标状态行动值函数Q^，网络结构同Q网络，初始化权重参数θ^-＝θ；

步骤四，设定训练轮数用Episode表示，使其等于M；

步骤五，初始化网络输入序列s₁；

步骤六，以ε的概率随机选择动作a_t，或者a_t＝arg max_aQ(s_t,a,θ)；

步骤七，源节点执行动作a_t，观察奖赏r_t并得到下一个时刻的状态s_t+1；

步骤八，把(s_t,a_t,r_t,s_t+1)放入D中；

步骤九，随机从D中采样minibatch个样本，表示为(s_j,a_j,r_j,s_j+1)；

步骤十，计算每一个状态的目标值，并更新；如果在j+1步，Episode＝M，则y_j＝r_j，否则y_j＝r_j+γmax_a'Q^(s_j+1,a'；θ^-)，γ为折扣因子；

步骤十一，梯度下降(y_j-Q^(s_j,a_j'；θ^-))²，更新网络参数θ；

步骤十二，每隔c步，使Q^＝Q；

步骤十三，当Episode小于M，返回执行步骤五。

2.根据权利要求1所述的基于深度强化学习的水下联合中继选择和功率分配方法，其特征在于，所述创建拓扑结构的步骤中还包括水下节点的分布设计和水下环境的模拟；

所述水下节点的分布设计为水下节点随机分布在规定范围内；

所述水下环境的模拟包括水下信道增益和水下环境噪声。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于燕山大学，未经燕山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010694039.3/1.html，转载请声明来源钻瓜专利网。

上一篇：限制性双向航道船舶交通组织优化方法
下一篇：分布式网络态势感知方法、系统、服务器及节点设备

同类专利

专利分类

H04 电通信技术
H04W 无线通信网络
H04W40-00 通信路由或通信路径查找
H04W40-02 .通信路由或路径选择，例如，基于功率的或最短路径路由
H04W40-24 .连接性信息管理，例如，连接性发现或连接性更新
H04W40-34 .现有路由的更改
H04W40-36 ..由于切换
H04W40-38 ..由于改变节点之间相对距离的适应

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：76009968。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

400-8765-105周一至周五 9:00-18:00

版权所有钻瓜科技（天津）有限公司津ICP备15000985号津公网安备 12019202000206号http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top