[发明专利]一种防止策略抖动的无人机控制策略强化学习生成方法有效

申请号：	202210701895.6	申请日：	2022-06-20
公开（公告）号：	CN115061371B	公开（公告）日：	2023-08-04
发明（设计）人：	彭宣淇;朴海音;詹光;孙阳;冯勇明;杨晟琦;于津;张健	申请（专利权）人：	中国航空工业集团公司沈阳飞机设计研究所
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	北京航信高科知识产权代理事务所(普通合伙) 11526	代理人：	王伟立
地址：	110035 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法，包括：初始化无人机控制策略网络及值网络；无人机控制策略在环境中的采样；采用GAE方法，根据样本估计优势函数；在优势函数上叠加防止无人机操控策略抖动的规范化项；更新无人机控制策略网络与值网络；重复上述步骤直至收敛，从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构，将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项，用以抑制不必要的动作切换，实现不改变原有最优策略情况下，有效降低强化学习方法生成策略的抖动，使强化学习生成的策略更容易应用于真实环境中。
搜索关键词：	一种防止策略抖动无人机控制强化学习生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司沈阳飞机设计研究所，未经中国航空工业集团公司沈阳飞机设计研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210701895.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种防止策略抖动的无人机控制策略强化学习生成方法有效

专利文献下载