[发明专利]一种基于优先级随机抽样策略的Double DQN无人机隐蔽接敌方法在审

申请号：	201911009182.8	申请日：	2019-10-21
公开（公告）号：	CN110673488A	公开（公告）日：	2020-01-10
发明（设计）人：	丁勇;何金;高振龙	申请（专利权）人：	南京航空航天大学
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	211106 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公布了一种基于优先级随机抽样策略的Double DQN无人机隐蔽接敌方法，包括：首先，建立隐蔽接敌双方空战态势示意图，由该图建立隐蔽接敌过程的优势区域与暴露区域；其次，建立无人机的状态空间并转化为特征空间和基于速度限制的无人机动作空间；然后，构建基于优先级随机抽样策略的双深度Q学习网络；接着，根据优势区域与暴露区域中敌我双方相对位置构建目标势函数奖赏，由无人机与障碍物的距离构建障碍物奖赏，将二者叠加为总奖赏对Double DQN神经网络进行隐蔽接敌训练；最后，将无人机当前的特征序列输入至训练后的Double DQN中的Q目标神经网络，得到无人机最优隐蔽接敌策略。该方法主要解决了无人机无模型隐蔽接敌问题。
搜索关键词：	隐蔽构建奖赏暴露区域随机抽样优势区域障碍物动作空间目标神经神经网络速度限制特征空间特征序列状态空间势函数叠加网络转化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于优先级随机抽样策略的Double DQN无人机隐蔽接敌方法，其特征在于，包括：/n步骤1，建立隐蔽接敌双方空战态势示意图，由该图建立隐蔽接敌过程的优势区域与暴露区域。/n步骤2，建立无人机在环境中的状态空间，并将其转换为特征空间。/n步骤3，建立基于速度限制的无人机动作空间。/n步骤4，构建基于优先级随机抽样策略的双深度Q学习网络。/n步骤5，根据优势区域与暴露区域构建目标势函数奖赏，利用无人机与障碍物的距离构建障碍物奖赏，将二者叠加构成总的势函数奖赏。/n步骤6，利用总的势函数奖赏对Double DQN神经网络进行训练，更新网络参数。/n步骤7，将无人机当前的特征序列输入训练后的Double DQN中的Q目标神经网络，得到无人机最优隐蔽接敌策略。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航空航天大学，未经南京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911009182.8/，转载请声明来源钻瓜专利网。

上一篇：用于四色LED光源缓解飞行时差反应的光谱优化方法及系统
下一篇：一种商用建筑房间的热负荷辨识方法

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于优先级随机抽样策略的Double DQN无人机隐蔽接敌方法在审

专利文献下载