本发明公开了一种面向数据采集的多无人机智能航迹规划方法。该发明属于无人机控制领域,主要解决了无人机在未知大规模环境中收集节点数据时的动态自主航迹规划问题。所提方法通过将无人机航迹规划问题建模成为部分可观测马尔可夫决策过程,利用深度强化学习对问题进行求解。该方法通过集中式训练、分布式应用的方式,实现了多无人机在未知环境中采集节点数据时动态规划飞行轨迹,使用了ED3QN(Extended Double Dueling Deep Q‑Network)方法通过与仿真环境的交互训练出可自主动态规划无人机航迹的智能体。此外,该方法还通过加入竞争机制和候选节点队列,解决了多机协同问题;用奖励重塑法设计了非稀疏的奖励函数,使之适用于大规模复杂环境;通过机载全向激光雷达获取障碍物信息,减小环境中动态或静态障碍物对无人机飞行安全的威胁。大量的仿真实验证明了该方法的有效性和鲁棒性。