[发明专利]一种基于深度强化学习的四旋翼无人机航线跟随控制方法有效
申请号: | 201911002811.4 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110673620B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 李波;杨志鹏;万开方;高晓光;甘志刚;梁诗阳;越凯强 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G05D1/08 | 分类号: | G05D1/08;G05D1/10 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于深度强化学习的四旋翼无人机航线跟随控制方法,该方法首先建立了四旋翼无人机航线跟随深度强化学习算法的马尔可夫模型,然后采用深度确定性策略梯度(DDPG)算法进行深度强化学习,克服以往基于强化学习的方法控制精度较低、无法实现连续控制和学习过程不稳定等问题,实现高精度的四旋翼无人机航线跟随控制。本发明方法将强化学习与深度神经网络相结合,提高了模型的学习能力和泛化能力,避免了在不确定性环境中人为操作无人机飞行的繁琐性和粗疏性,使得无人机完成航线跟随任务更为安全高效,同时在无人机目标跟踪、自主避障等场景中有很好的应用前景。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 四旋翼 无人机 航线 跟随 控制 方法 | ||
【主权项】:
1.一种基于深度强化学习的四旋翼无人机航线跟随控制方法,其特征在于,包括以下步骤;/n步骤1:采用如下步骤定义四旋翼无人机航线跟随深度强化学习算法的马尔可夫模型:/n对马尔科夫决策过程MDP的五元组(s,A,P,R,γ)进行建模,其中s为四旋翼无人机的输入状态,A为四旋翼无人机的输出动作集,P为状态转移概率函数,R为奖励函数,γ为折扣系数;/n步骤1-1:确定四旋翼无人机的输入状态s:/n建立机体坐标系c
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911002811.4/,转载请声明来源钻瓜专利网。