[发明专利]一种基于深度强化学习的能量约束下多机探索方法及系统在审
| 申请号: | 202211495294.0 | 申请日: | 2022-11-26 |
| 公开(公告)号: | CN115933734A | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 史殿习;周雅婷;杨焕焕;张玉晖;陈洋;李彤月;周晨磊;胡浩萌 | 申请(专利权)人: | 天津(滨海)人工智能创新中心 |
| 主分类号: | G05D1/10 | 分类号: | G05D1/10 |
| 代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
| 地址: | 300450 天津市滨海新*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种基于深度强化学习的能量约束下多机探索方法及系统,包括:基于预先构建的无人机的数学模型获取当前视图;对当前视图进行预处理后输入到CNN中进行特征提取,得到提取的特征;将提取的特征输入预先训练好的DDQN强化学习算法,得到无人机的动作;通过安全控制器判断无人机的动作是否可执行,确定无人机的动作;其中,无人机的数学模型是以最大化全局的探索效率为目标函数结合无人机运行约束、状态空间和奖励函数构建得到的;DDQN强化学习算法是采用目标网络和经历回放方法训练得到的;本发明提供了一种惩罚函数,能够使探索系统在保证较高探索效率的同时让系统获得较高的返航率,即无人机能够在完成探索任务的同时在能量耗尽前返回起飞降落区。 | ||
| 搜索关键词: | 一种 基于 深度 强化 学习 能量 约束 下多机 探索 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津(滨海)人工智能创新中心,未经天津(滨海)人工智能创新中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211495294.0/,转载请声明来源钻瓜专利网。





