[发明专利]一种基于深度强化学习的智能交通灯控制方法及装置有效
申请号: | 202211038957.6 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115472023B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 徐小龙;张骁 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G08G1/07 | 分类号: | G08G1/07;G08G1/08;G08G1/01;G06F30/27;G06N3/092 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 刘艳艳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 智能 交通灯 控制 方法 装置 | ||
本发明公开了一种基于深度强化学习的智能交通灯控制方法及装置,包括:每个路口设置一个智能体,用于该路口的交通灯控制;智能体获取当前交通状态;其中所述当前交通状态包括当前路口的数据信息和相邻路口的数据信息;将当前交通状态输入训练好的Q‑神经网络;根据Q‑神经网络的输出,确定这个智能体对对应路口交通灯的控制动作,其中所述Q‑神经网络的构建训练方法包括:基于实际交通状况在仿真平台构建了交通路网和时变交通流与智能体江西交互生成经验元组,对Q‑神经网络进行训练。采用深度强化学习算法,算法包含多个智能体,每个智能体控制一个交叉路口,通过智能体之间的通信与协调达到全局调控。
技术领域
本发明涉及交通仿真技术领域,涉及一种基于深度强化学习的智能交通灯控制方法及装置,具体涉及一种面向大规模交通路网的智能交通灯控制方法。
背景技术:
随着社会的快速发展,城市化所带来的各种问题越来越明显,其中以交通拥堵、交通事故、汽车引起的环境恶化等问题尤为严重。在这种情况下,越来越多的学者投入到改善交通环境的调研当中。
缓解交通拥堵的办法之一就是实现对交通信号灯的智能控制。当前社会中,大多数的交通信号灯仍然采取预先设定好的固定时间进行交通控制。定时交通控制缺点十分明显。由于信号相位和时间设计方案的参数都是固定不变的,无法根据实时交通量的变化而随之改变,交通路口经常出现绿灯时无车同行,红灯时等待车辆较多的情况,使得交通路口的通行效率很低。最近的一些研究根据真实的交通数据提出了手动指定的规则,但这些规则仍旧是通过预定义方式控制交通信号,不能根据实时流量动态调整。为了实现对交通信号灯实时的控制,学者们将强化学习技术应用在智能交通控制上。与传统的模型驱动方法不同,强化学习不依赖启发式假设和方程。相反,它根据与复杂交通系统交互的经验,直接使用参数化模型来学习最优控制。然而传统的强化学习面临两个困难的挑战:如何表示环境、如何实现环境和策略之间关系的建模。近年来,研究者们将深度强化学习应用到了智能交通灯控制当中,并取得了更好的效果。但是当前很多基于深度强化学习的算法其优化目标和现实交通灯控制的最终目标并不相符。智能交通灯控制的最终目标应该是从全局角度统计达到最优效果的控制,然而很多基于深度强化学习的控制算法都单独进行交通信号控制,无法实现协同合作。
综上所述,需要一种能够进行协同合作,实现对多个交通路口全局调控,从而缩短车辆在路口的平均等待时间的基于深度强化学习的智能交通灯控制方式。
发明内容
本发明的目的在于提供一种基于深度强化学习的智能交通灯控制方法,能够解决传统交通控制实时性差、延迟率高、拥堵车辆多等问题。
技术方案:为解决上述技术问题,本发明采用的技术方案为:
第一方面,提供一种基于深度强化学习的智能交通灯控制方法,包括:
每个路口设置一个智能体,用于该路口的交通灯控制;
智能体获取当前交通状态;其中所述当前交通状态包括当前路口的数据信息和相邻路口的数据信息;
将当前交通状态输入训练好的Q-神经网络;
根据Q-神经网络的输出,确定这个智能体对对应路口交通灯的控制动作;
其中所述Q-神经网络的构建训练方法包括:
步骤1、通过仿真平台构建现实交通路网环境;
步骤2、基于仿真平台随机生成时变交通流量;
步骤3、智能体通过仿真平台获取当前阶段本地交通信息和邻接智能体的交通信息,结合生成当前交通状态s;
步骤4、智能体以当前交通状态s作为Q-神经网络的输入,以∈概率随机选取下一阶段动作a,以1-∈的概率选取Q-神经网络输出序列的最大值作为下一阶段动作a;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211038957.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种丙酸钙嫩化牛肉的方法
- 下一篇:一种丁酸梭菌动物饲料及其应用