[发明专利]基于多智能体深度强化学习的人群疏散仿真方法及系统在审
申请号: | 201910028487.7 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109670270A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 刘弘;郑尚菲 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250358 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开公开了基于多智能体深度强化学习的人群疏散仿真方法及系统,根据人群疏散中个体的初始坐标和运动速度创建仿真场景;在疏散场景的每一个疏散出口处设置计数器,根据区域面积和人数计算出口的拥挤度,拥挤度是为在深度强化学习模型中训练路径时进行回报奖励的反馈;根据每个个体距离各个子区域内房间出口的位置对全体个体进行分组,选取处于组内局部区域最前端的个体作为组内领导;利用多智能体深度确定性政策梯度算法MADDPG对领导进行路径规划,将多个领导看作是多个智能体,多个智能体之间相互协同进而选择最佳疏散路径,引领者根据深度强化学习规划好的路径进行疏散;在组内的各个成员在改进社会力下跟随领导进行疏散活动。 | ||
搜索关键词: | 强化学习 疏散 多智能体 人群疏散 拥挤度 智能体 计数器 初始坐标 仿真场景 局部区域 路径规划 人数计算 梯度算法 面积和 子区域 确定性 出口 协同 场景 反馈 分组 回报 奖励 创建 改进 规划 政策 | ||
【主权项】:
1.基于多智能体深度强化学习的人群疏散仿真方法,其特征是,包括:根据场景信息以及人群参数信息,进行疏散场景仿真模型内的参数的初始化设置;计算每个出口的拥挤度;实现对全体个体进行分组;选取组内领导;将每一个组内领导视为一个智能体Agent,利用多智能体深度确定性策略梯度算法MADDPG进行路径规划,MADDPG算法中的评论员Critic依据每个出口的拥挤度对智能体的出口选择给出对应的回报奖励;进而为每个智能体输出最佳疏散路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910028487.7/,转载请声明来源钻瓜专利网。