[发明专利]缓解交通拥堵驾驶员控制系统、方法、介质、设备及应用有效
| 申请号: | 202111508564.2 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN114267191B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 李雪原;杨帆;尹旭峰;高鑫;刘琦 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G08G1/0962 | 分类号: | G08G1/0962;G06N3/042;G06N3/092 |
| 代理公司: | 成都天汇致远知识产权代理事务所(普通合伙) 51264 | 代理人: | 韩晓银 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 缓解 交通 拥堵 驾驶员 控制系统 方法 介质 设备 应用 | ||
1.一种缓解交通拥堵驾驶员控制方法,其特征在于,所述缓解交通拥堵驾驶员控制方法采用集中学习但分散执行的设定,每个目标车辆节点在每个时刻均做一个决策,为所有节点实现相同的给定目标,有序通过从而解决交通拥堵问题;节点间的通信和信息传播采用图神经网络GNN进行建模,决策处理器采用Deep Q learning,形成的决策信息以建议指令的形式下发给每一位环境内的驾驶员;
所述缓解交通拥堵驾驶员控制方法,还包括强化学习模型构建,所述强化学习模型结构,包括:在每一个时间步t,在目标车辆周围的N个其他车辆均可被检测到,故每个时间步t对应的模型空间的输入设置为状态s,该状态s是一个由三个信息模块组成的元组,包括:节点特性Xt、关联矩阵At,记录车辆的索引矩阵Mt;其中节点特性Xt包括速度vi、纵向位置pi、横向车道位置li以及行驶意图Ii,关联矩阵At表示目标车辆及其周围车辆之间的交互关系,索引矩阵Mt用于将目标车辆从所有节点中筛选出来。
2.如权利要求1所述的缓解交通拥堵驾驶员控制方法,其特征在于,所述缓解交通拥堵驾驶员控制方法,还包括环境建模,对于环境的建模定义为信息拓扑结构;所述环境建模,包括:根据车辆的空间位置和相对关系,将该模型分解为局部和全局两层,所述局部网络是一个星形图,包括目标车辆以及其周围的所有其他车辆个体;所述全局网络由当前环境内的所有车辆个体组成;目标车辆既通过车载传感器从附近的其他车辆获取局部信息,又通过云端连接通道从其他环境内的车辆获取全局信息。
3.如权利要求2所述的缓解交通拥堵驾驶员控制方法,其特征在于,在局部星形网络中,信息从周围车辆传递到目标车辆;所有的目标车辆共享其他车辆的局部感知信息。
4.如权利要求1所述的缓解交通拥堵驾驶员控制方法,其特征在于,所述强化学习模型结构,还包括:节点特性Xt输入到全连接FCN层,FCN的输出与关联矩阵At同时输入图神经卷积网络GCN层并行计算,将输出结果与索引矩阵Mt进行点积运算进行车辆节点的筛选,最后通过Q网络计算输出Q值供参数进化迭代使用;
在正式训练开始前,设置T个时间步作为“热身阶段”;从T+1时间步开始,按照奖励最大化以及损失最小化的原则对模型进行训练,用于保证模型训练的稳定性,使得车辆节点对环境进行探索。
5.一种实施权利要求1~4任意一项所述缓解交通拥堵驾驶员控制方法的缓解交通拥堵驾驶员控制系统,其特征在于,所述缓解交通拥堵驾驶员控制系统,包括:
环境模型构建模块,用于根据车辆的空间位置和相对关系,将环境模型分解为局部和全局两层,并将环境的建模定义为信息拓扑结构;
强化学习模型构建模块,用于将节点节点特性Xt输入到全连接FCN层,FCN的输出与关联矩阵At同时输入图神经网络GCN层进行并行计算,将输出结果与索引矩阵Mt进行点积运算进行车辆节点的筛选,最后通过Q网络计算输出Q值供参数进化迭代使用;
交通拥堵缓解模块,用于采用集中学习但分散执行的设定,每个目标车辆节点在每个时刻均做一个决策,为所有节点实现相同的给定目标,即有序通过从而解决交通拥堵问题;
决策信息建立下发模块,用于将节点间的通信和信息传播采用图神经网络GNN进行建模,决策处理器采用Deep Q learning,形成的决策信息以建议指令的形式下发给每一位环境内的驾驶员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111508564.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种艾叶自动分离装置
- 下一篇:一种钢轨表面视觉检测方法和装置





