[发明专利]基于深度强化学习的专用自组网抗干扰方法在审

申请号：	201910431474.4	申请日：	2019-05-22
公开（公告）号：	CN110213025A	公开（公告）日：	2019-09-06
发明（设计）人：	徐莹莹;雷鸣;赵民建;王婵;李旻	申请（专利权）人：	浙江大学
主分类号：	H04L1/16	分类号：	H04L1/16;H04L1/00;H04L12/24
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	郑海峰
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出了一种基于深度强化学习的专用自组网抗干扰方法，该方法包括如下步骤：(1)将发送端的历史动作和对应观察结果组成的序列作为模型的输入；(2)模型通过对历史样本的不断学习，调整神经网络的参数，直至收敛，从而得到最优的DQN抗干扰模型；(3)在当前时刻的输入下，模型将不同动作对应的Q值作为一个序列输出；(4)若干扰状况会发生改变，则模型重新训练以得到最优的DQN抗干扰模型。本发明将深度强化学习应用于专用自组网中，构建的抗干扰模型可以通过对历史样本的学习优化模型，从而指导发送端避开干扰成功发包。由于引入了深度强化学习，该方法能够更智能、更快速地指导发送端发包，并降低网络的丢包率。
搜索关键词：	抗干扰强化学习自组网历史样本发送端发送端的干扰状况历史动作神经网络序列输出优化模型丢包率构建收敛避开智能学习引入应用网络成功
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度强化学习的专用自组网抗干扰方法，其特征在于，具体包括如下步骤：(1)在基于DQN的抗干扰模型中，将发送端先前M个单位时间的历史动作和对应观察结果组成的序列作为输入；(2)基于DQN的抗干扰模型通过对历史样本的不断学习，调整神经网络的参数，直至收敛，从而得到最优的DQN抗干扰模型；(3)在当前时刻的输入状态下，模型计算得到不同动作对应的Q值，并将其作为一个序列输出。发送端再从DQN模型的输出序列中选择最大Q值所对应的动作作为下一时刻的动作；(4)模型不断地计算先前一段时间的平均累积回报，当干扰状况不变时，模型会最终收敛，平均累积回报达到稳定；当干扰状况改变时，平均累积回报开始震荡，若性能下降到一定程度，则模型重新进行步骤(1)、(2)和(3)的训练直到收敛。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910431474.4/，转载请声明来源钻瓜专利网。

上一篇：数据包重传方法、装置及设备
下一篇：通信系统中反馈信息的传输方法及装置

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L1-00 检测或防止收到信息中的差错的装置
H04L1-02 .应用分集接收
H04L1-08 .应用重发，例如Verdan系统
H04L1-12 .应用返回信道
H04L1-20 .用信号质量检测器
H04L1-22 .用冗余装置以提高可靠性

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度强化学习的专用自组网抗干扰方法在审

专利文献下载