[发明专利]一种多智能体强化学习方法及系统在审
申请号: | 202210233742.3 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114676846A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 时大明;范文慧;刘义;黄亚东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F9/50 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 孟省 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种多智能体强化学习方法及系统,其中的方法包括:获取多智能体的共享经验数据集;根据共享经验数据集,对初始策略进行训练,得到共享策略;获取多智能体当前的目标状态;将目标状态输入至共享策略,获取目标决策动作,该方法使得多智能体可以根据自身需要随时调用共享策略,不需要多智能体中每一个智能体单独维护一个策略模块,从而避免了存储空间和计算资源的浪费,并保持了多智能体策略的一致性。 | ||
搜索关键词: | 一种 智能 强化 学习方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210233742.3/,转载请声明来源钻瓜专利网。