[发明专利]一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法在审
申请号: | 202210687553.3 | 申请日: | 2022-06-17 |
公开(公告)号: | CN114967472A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 吴吉莹;杨忠;廖禄伟;何乃峰;王志永;王灿 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 徐红梅 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法,采用深度确定性策略梯度算法,网络结构包括控制网络、评价网络和补偿网络,将控制网络的控制量输出与补偿网络的补偿输出相结合作为输出控制量与环境交互,评价网络对输出控制量进行价值评价,使无人机能够以最精确、连续、平滑的方式快速跟踪动态目标;在生成控制量的基础上加入随机噪声,实现一定范围的探索,使控制量值估计更加准确。本发明针对基于深度强化学习的无人机轨迹跟踪控制算法在未知环境下训练效率低,收敛性不稳定的情况,提出了一种结合状态补偿网络的状态补偿深度确定性策略梯度算法,能够显著提高无人机在轨迹跟踪任务中的训练效率和收敛性稳定性。 | ||
搜索关键词: | 一种 无人机 轨迹 跟踪 状态 补偿 深度 确定性 策略 梯度 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210687553.3/,转载请声明来源钻瓜专利网。