[发明专利]一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法在审

申请号：	202210687553.3	申请日：	2022-06-17
公开（公告）号：	CN114967472A	公开（公告）日：	2022-08-30
发明（设计）人：	吴吉莹;杨忠;廖禄伟;何乃峰;王志永;王灿	申请（专利权）人：	南京航空航天大学
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	徐红梅
地址：	210016 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法，采用深度确定性策略梯度算法，网络结构包括控制网络、评价网络和补偿网络，将控制网络的控制量输出与补偿网络的补偿输出相结合作为输出控制量与环境交互，评价网络对输出控制量进行价值评价，使无人机能够以最精确、连续、平滑的方式快速跟踪动态目标；在生成控制量的基础上加入随机噪声，实现一定范围的探索，使控制量值估计更加准确。本发明针对基于深度强化学习的无人机轨迹跟踪控制算法在未知环境下训练效率低，收敛性不稳定的情况，提出了一种结合状态补偿网络的状态补偿深度确定性策略梯度算法，能够显著提高无人机在轨迹跟踪任务中的训练效率和收敛性稳定性。
搜索关键词：	一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航空航天大学，未经南京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210687553.3/，转载请声明来源钻瓜专利网。

上一篇：多波长消色差超薄平面透镜的设计方法
下一篇：一种油墨生产用进料装置及其进料方法

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法在审

专利文献下载