[发明专利]一种基于深度强化学习的智能兵棋推演决策方法在审
| 申请号: | 202310612393.0 | 申请日: | 2023-05-26 |
| 公开(公告)号: | CN116596343A | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 费蓉;陈汭竹;李爱民;吴丽丽;马梦阳;王宏博 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06Q10/0637 | 分类号: | G06Q10/0637;G06Q10/063;G06F30/27;G06F18/241;G06N3/0464;G06N3/082;G06N3/092;G06N3/047 |
| 代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张莹 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于深度强化学习的智能兵棋推演决策方法,包括:构建兵棋推演环境中智能体的状态空间;构建适用于兵棋智能推演环境下低优势策略‑价值网络架构;构建作战场景判断模型,作为环境奖励来源依据;在兵棋推演系统中搭建智能决策系统;对所述步骤1至4得到的智能体状态空间、低优势策略‑价值网络架构、作战场景判断模型和智能决策系统所构成的深度神经网络进行训练,得到基于深度强化学习的智能兵棋推演决策模型;在所述智能兵棋推演决策模型中,对当前作战场景状态下的战术兵棋智能体作战决策进行求解。通过上述方式,本发明能够改进战术兵棋智能体在作战推演中产生作战决策的效率,加快作战策略网络训练过程的收敛速度。 | ||
| 搜索关键词: | 一种 基于 深度 强化 学习 智能 推演 决策 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310612393.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种抗水树电缆绝缘材料及其制备方法
- 下一篇:倾斜裁断装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





