[发明专利]一种车辆的自动驾驶方法、系统、设备及存储介质在审
申请号: | 202211259650.9 | 申请日: | 2022-10-14 |
公开(公告)号: | CN115578876A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 邓琪;李茹杨;张亚强;胡奇夫;赵雅倩;李仁刚 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G08G1/0967 | 分类号: | G08G1/0967;G08G1/0968 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 崔俊红 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车辆 自动 驾驶 方法 系统 设备 存储 介质 | ||
1.一种车辆的自动驾驶方法,其特征在于,包括:
规划出从出发地位置到达目的地位置的参考路径,并根据所述参考路径确定出用于反映车辆静态路径的静态导航信息;
根据车载传感设备的检测内容,以及接收到的路侧传感设备的检测内容,通过特征提取,得到用于反映车辆自身驾驶状态的感知状态输入量;
确定出用于反映车辆与环境交互过程中的历史决策信息的关联性特征;
将所述车载传感设备的检测内容发送至路侧系统,并接收所述路侧系统反馈的用于反映路侧传感设备的检测区域内的各车辆未来行为的行为预测信息;
将所述静态导航信息,所述感知状态输入量,所述关联性特征以及所述行为预测信息作为输入量输入至深度强化学习模型,得到所述深度强化学习模型输出的驾驶策略;
执行所述驾驶策略。
2.根据权利要求1所述的车辆的自动驾驶方法,其特征在于,接收到的所述路侧系统反馈的用于反映路侧传感设备的检测区域内的各车辆未来行为的行为预测信息,为所述路侧系统通过以下操作确定出的行为预测信息:
根据所述车载传感设备的检测内容,以及路侧传感设备的检测内容,确定出所检测到的各个车辆各自的历史轨迹序列
对所述历史轨迹序列进行线性变换与归一化处理,得到对应的低维融合特征
将得到的各个低维融合特征传递至滤波模型,以通过所述滤波模型衰减频域中的噪声信息;
将所述滤波模型的输出发送至基于MLP的行为预测模型,得到所述行为预测模型输出的用于反映路侧传感设备的检测区域内的各车辆未来行为的行为预测信息;
其中,N为序列长度,zi为历史轨迹序列中的第i轨迹点的环境上下文信息,oi为历史轨迹序列中的第i轨迹点的车辆观测信息;xi为低维融合特征x中的第i特征量。
3.根据权利要求2所述的车辆的自动驾驶方法,其特征在于,所述滤波模型由多个滤波子模型堆叠而成,每个所述滤波子模型包括滤波层,第一随机失活层,第二随机失活层,前馈层,第一归一化层以及第二归一化层;
所述滤波层用于将输入进行快速傅里叶变换之后,通过SGD进行优化以衰减频域中的噪声信息,并通过逆快速傅里叶变换将优化结果变换回时域;
所述第一随机失活层用于接收所述滤波层的输出,并在进行残差连接之后由所述第一归一化层进行归一化,得到的结果作为所述前馈层的输入;
所述前馈层用于在MLP结构下,通过激活函数从自身输入中提取非线性特征,得到的结果作为所述第二随机失活层的输入;
所述第二随机失活层用于接收所述前馈层的输出,并在进行残差连接之后由所述第二归一化层进行进行归一化,得到的结果作为所在的滤波子模型的输出。
4.根据权利要求2所述的车辆的自动驾驶方法,其特征在于,基于MLP的所述行为预测模型的损失函数Lbase(δ)设置为:
其中,δ为模型参数,为指示函数,为第k条预测轨迹中车辆未来t时刻的状态,为预测均值,为预测方差,K为预测轨迹总数,为第k条预测轨迹的输出概率,T为预测轨迹长度,为地面真实轨迹,M为地面真实轨迹总数;
得到所述行为预测模型输出的用于反映路侧传感设备的检测区域内的各车辆未来行为的行为预测信息为
其中,H为被检测区域内的车辆总数,为所述行为预测模型输出的表示第i车辆概率最大的预测轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211259650.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种催化反应设备
- 下一篇:黑色金属冶炼压延品焊接设备