[发明专利]基于深度强化学习的多无人机基站协同覆盖路径规划方法在审
| 申请号: | 202310021781.1 | 申请日: | 2023-01-07 |
| 公开(公告)号: | CN116227767A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 管昕洁;许昱雯;万夕里;张毅晔;徐波 | 申请(专利权)人: | 南京工业大学;江苏省未来网络创新研究院 |
| 主分类号: | G06Q10/047 | 分类号: | G06Q10/047;G06F30/27;G06F18/20;G06N3/04;G06N3/092;G06F111/08 |
| 代理公司: | 南京科阔知识产权代理事务所(普通合伙) 32400 | 代理人: | 苏兴建 |
| 地址: | 211899 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 强化 学习 无人机 基站 协同 覆盖 路径 规划 方法 | ||
本发明公开了一种基于深度强化学习的多无人机基站协同覆盖路径规划方法,步骤包括:首先定义了基于深度强化学习的马尔可夫模型,对马尔科夫决策过程五元组进行建模;然后根据建模提出深度确定性策略梯度DDPG算法;接着对DDPG算法的经验缓存池进行改进,通过对经验缓存池所存储的经验数据进行分类,将获取的经验数据放入不同的经验缓存池中,改进的DDPG算法能解决收敛不稳定的问题;最后设计仿真环境,无人机群与环境进行交互,获取训练数据。通过这种方法,实现无人机群在多个约束条件的限制下对地面节点进行协同覆盖的目标任务,该方法能使无人机群有更高的规划效率和更低的飞行成本。
技术领域
本发明提出一种基于深度强化学习的多无人机基站协同覆盖路径规划方法,属于计算机人工智能领域。
背景技术
无人机具有机动性高、部署灵活、成本低的优势,已广泛应用于地形覆盖、农业生产、环境侦察、空中救援、灾害预警等行业。无人机可以作为空中基站,增强各种场景下通信网络的覆盖范围和性能。当地面通信网络出现意外而中断时,可以快速部署无人机,无人机将与地面建立通信链路以传输数据,同时实现与地面网络的协同交互。覆盖路径规划算法是支撑无人机成功应用于上述复杂场景的一项重要技术。
在规划无人机覆盖地面节点路径的过程中,需要考虑无人机的能量约束条件,同时无人机在执行任务的过程中需要保证与地面基站的信号传输,但信号传输会产生损耗影响覆盖的服务质量。另一方面,单个无人机由于能量和通信的约束,难以大规模应用于地面覆盖任务,多无人机协同飞行是实现大规模覆盖任务的有效方案,这需要无人机之间时刻保持通信连通。因此无人机群在能耗受限、通信连通距离受限、信号传输会产生损耗的约束条件下,如何高效实现对地面节点的协同覆盖是一个极具挑战的理论与应用问题。
发明内容
为解决在多种约束条件下,如何实现对地面进行高效协同覆盖的问题,本发明提出一种基于深度强化学习的多无人机基站协同覆盖路径规划方法,具体包括以下步骤:
步骤一、定义马尔可夫模型:对马尔科夫决策过程五元组(S,A,P,R,γ)进行建模;
步骤二、以步骤一建模得到的马尔科夫决策过程五元组(S,A,P,R,γ)为基础,设计使用基础深度强化学习的深度确定性策略梯度(DDPG)算法;
步骤三、对DDPG算法的经验缓存池进行改进,通过对经验缓存池所存储的经验数据进行分类,将获取的经验数据放入不同的经验缓存池中。
步骤四、设计仿真环境,无人机群与环境进行交互,获取训练数据,采样训练数据进行仿真训练,实现对目标地面节点的协同覆盖路径规划。
步骤一的具体步骤包括:
步骤1.1、确定无人机的所处状态S:
整个目标区域被划分成I×J个单元格,区域内随机分布有m个位置固定的地面节点和n架飞行于固定高度H的无人机,无人机i在t时刻的坐标表示为第u个地面节点的位置坐标表示为qu=(xu,yu)。一架无人机的固定总能量为emax,无人机移动一个单位的能耗为e1,悬停覆盖一个地面节点的能耗为e2,e1、e2均为常数,无人机必须在能量耗尽之前完成任务。因此无人机i从初始位置飞行到在t时刻位置时的能耗为:
其中,为无人机i在t时刻已覆盖地面节点的数量;
每架无人机的通信半径固定为Rs,由于通信连通性的限制,无人机i必须始终保持和自己最近的无人机j在通信半径范围之内,有公式:
min(||pi-pj||,i≠j)<=Rs
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学;江苏省未来网络创新研究院,未经南京工业大学;江苏省未来网络创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310021781.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





