[发明专利]基于在线增强学习模型的全流程任务时序智能决策方法在审
申请号: | 202011331267.0 | 申请日: | 2020-11-24 |
公开(公告)号: | CN113379063A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 张旭辉;王振亚;路鹰;郑本昌;黄虎;任金磊;张佳;李君;吴志壕;范佳宣;阎岩;古月;韩特;何漫 | 申请(专利权)人: | 中国运载火箭技术研究院 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08;G06N7/00;G06K9/62 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 张辉 |
地址: | 100076 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于在线增强学习模型的全流程任务时序智能决策方法,第一步,针对红蓝方对抗推演场景,建立增强学习模型,实现面向场景信息的任务时序决策;第二步,采用在线学习异步训练方法对增强学习模型进行强化学习训练,提升训练的鲁棒性和稳定性;第三步,以红方的全流程任务完成概率为基准,通过融合不同的探测与识别弧段得到全局任务完成概率,作为反馈信息;第四步,以全局任务完成概率作为反馈,完成增强学习模型在功能级干扰对抗决策上的训练和部署。本发明解决了现有技术中存在的红蓝方推演全流程任务时序决策效率低、泛化性差等问题。 | ||
搜索关键词: | 基于 在线 增强 学习 模型 流程 任务 时序 智能 决策 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国运载火箭技术研究院,未经中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011331267.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种污泥干化设备
- 下一篇:车辆用动力传递装置的锁止控制装置和锁止控制方法