[发明专利]一种基于生成对抗模仿学习的车辆个性化跟驰控制方法有效
申请号: | 202111568497.3 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114148349B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 任玥;邹博文;梁新成 | 申请(专利权)人: | 西南大学 |
主分类号: | B60W60/00 | 分类号: | B60W60/00;B60W30/14;B60W40/08 |
代理公司: | 重庆鼎慧峰合知识产权代理事务所(普通合伙) 50236 | 代理人: | 徐璞 |
地址: | 400700*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 模仿 学习 车辆 个性化 控制 方法 | ||
1.一种基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,包括以下步骤:
建立模拟跟车仿真环境,所述模拟跟车仿真环境包括道路模型、主车和前车;
在所述模拟跟车仿真环境中设置前车不同的速度曲线;
据前车不同的速度曲线在所述模拟跟车仿真环境中进行模拟驾驶跟驰试验,采集主车和前车的驾驶数据得到连续跟驰片段,选取多个连续跟驰片段建立驾驶员跟驰数据集;
使用生成对抗网络模仿强化学习方法,根据驾驶员跟驰数据集构建车辆个性化跟驰控制模型;
使用车辆个性化跟驰控制模型对车辆进行个性化跟驰控制。
2.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,建立模拟跟车仿真环境包括:
采用自动驾驶仿真平台搭建模拟跟车仿真环境;
对于主车采用车辆动力学仿真软件进行主车动力学建模;
采用随机交通流模型描述周围车辆运动情况。
3.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,前车不同的速度曲线包括:前车匀速行驶、减速行驶、紧急制动、随机变速行驶。
4.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,跟驰状态包括:主车与前车的相对距离d,主车与前车的相对速度vr,主车车速vh,动作为主车纵向加速度ah。
5.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,构建车辆个性化跟驰控制模型包括:
以主车与前车的相对距离、相对速度、主车车速作为输入,以主车纵向加速度作为输出,建立策略生成神经网络;
以主车与前车的相对距离、相对速度、主车车速及主车纵向加速度作为输入,以真、假值作为输出,建立判别神经网络;
从驾驶员数据集均匀抽样获得一个连续跟驰片段:其中分别代表第m步跟驰状态和驾驶员实际动作;
将获得的一个连续跟驰片段输入到策略生成神经网络与仿真环境进行交互,获得仿真跟驰片段:其中分别代表仿真过程第n步的跟驰状态和策略生成神经网络输出动作;
将仿真跟驰片段输入到判别神经网络中,采用判别神经网络对策略生成神经网络输出的真实程度进行判别;
使用多个连续跟驰片段训练策略生成神经网络;
使用多个仿真跟驰片段训练判别神经网络;
采用梯度下降方法更新判别神经网络参数。
6.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,策略生成神经网络的输入层神经元为3个,分别为相对距离、主车车速和相对速度;输出层神经元为1个,为主车纵向加速度;隐藏层为2层,每个隐藏层的神经元分别为5个;策略生成神经网络表示为:
f=π(a|s;ω)
其中,a表示动作,a=[ah];s表示车辆状态,s=[d,vh,vr];ω表示策略生成神经网络参数。
7.根据权利要求1所述的基于生成对抗模仿学习的车辆个性化跟驰控制方法,其特征在于,判别神经网络的输入层神经元为4个,分别为相对距离、主车车速、相对速度和主车纵向加速度,输出层神经元为1个,其值为(0,1);隐藏层为2层,每个隐藏层的神经元分别为5个;判别神经网络表示为:
pa=D(s,a;θ)∈(0,1)
其中,s表示车辆状态,s=[d,vh,vr];a表示动作,a=[ah];θ表示判别神经网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111568497.3/1.html,转载请声明来源钻瓜专利网。