[发明专利]基于多智能体深度强化学习的人群疏散仿真方法及系统在审

专利信息
申请号: 201910028487.7 申请日: 2019-01-11
公开(公告)号: CN109670270A 公开(公告)日: 2019-04-23
发明(设计)人: 刘弘;郑尚菲 申请(专利权)人: 山东师范大学
主分类号: G06F17/50 分类号: G06F17/50;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 250358 山东省*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开公开了基于多智能体深度强化学习的人群疏散仿真方法及系统,根据人群疏散中个体的初始坐标和运动速度创建仿真场景;在疏散场景的每一个疏散出口处设置计数器,根据区域面积和人数计算出口的拥挤度,拥挤度是为在深度强化学习模型中训练路径时进行回报奖励的反馈;根据每个个体距离各个子区域内房间出口的位置对全体个体进行分组,选取处于组内局部区域最前端的个体作为组内领导;利用多智能体深度确定性政策梯度算法MADDPG对领导进行路径规划,将多个领导看作是多个智能体,多个智能体之间相互协同进而选择最佳疏散路径,引领者根据深度强化学习规划好的路径进行疏散;在组内的各个成员在改进社会力下跟随领导进行疏散活动。
搜索关键词: 强化学习 疏散 多智能体 人群疏散 拥挤度 智能体 计数器 初始坐标 仿真场景 局部区域 路径规划 人数计算 梯度算法 面积和 子区域 确定性 出口 协同 场景 反馈 分组 回报 奖励 创建 改进 规划 政策
【主权项】:
1.基于多智能体深度强化学习的人群疏散仿真方法,其特征是,包括:根据场景信息以及人群参数信息,进行疏散场景仿真模型内的参数的初始化设置;计算每个出口的拥挤度;实现对全体个体进行分组;选取组内领导;将每一个组内领导视为一个智能体Agent,利用多智能体深度确定性策略梯度算法MADDPG进行路径规划,MADDPG算法中的评论员Critic依据每个出口的拥挤度对智能体的出口选择给出对应的回报奖励;进而为每个智能体输出最佳疏散路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910028487.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top