[发明专利]一种用于连续空间兵棋推演的多智能体决策方法在审
| 申请号: | 202111063370.6 | 申请日: | 2021-09-10 |
| 公开(公告)号: | CN113723013A | 公开(公告)日: | 2021-11-30 |
| 发明(设计)人: | 黄魁华;程光权;黄金才;成清;付阳辉;黄亭飞;梁星星 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08 |
| 代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开一种用于连续空间兵棋推演的多智能体决策方法,包括以下步骤:构建连续空间兵棋推演场景,得到用于兵棋推演的战场环境数据,多智能体进行初始化;构建经验重访数据集;多个智能体进行本地观测;基于CNN提取推演多智能体的多实体特征;多实体特征与多智能体的本地观测数据共同作为多智能体学习的输入,利用基于课程学习奖赏的Q学习训练多智能体;利用训练完成的多智能体进行对战决策;该发明中基于CNN的多实体特征提取方法收敛速度超过了基于全连接网络的特征提取方法;基于探索奖赏和竞争奖赏相结合的课程学习奖赏方法,克服了稀疏奖赏对动作指导不足、收敛慢的问题,使得多智能体的决策效率更高,决策方案更贴合对战实际。 | ||
| 搜索关键词: | 一种 用于 连续 空间 推演 智能 决策 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111063370.6/,转载请声明来源钻瓜专利网。





