[发明专利]无人车驾驶决策方法、无人车驾驶决策装置及无人车有效
申请号: | 201911113303.3 | 申请日: | 2019-11-14 |
公开(公告)号: | CN111079533B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李国法;李盛龙;杨一帆;纪泽锋;卢宗鹏;阳亮 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/774;B60W30/18 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李木燕 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无人 车驾 决策 方法 装置 | ||
1.一种无人车驾驶决策方法,其特征在于,包括:
获取当前决策时刻所述无人车前方道路的拍摄图像,得到待决策图像;
将所述待决策图像输入到训练后的决策模型中得到决策结果,所述决策结果包括多个候选驾驶动作、以及各个候选驾驶动作对应的决策值;
将所述决策结果中最大的决策值对应的候选驾驶动作确定为所述无人车在下一决策时刻的目标驾驶动作;
在将所述待决策图像输入到训练后的决策模型中得到决策结果之前,所述方法还包括:
获取多幅训练图像,其中,所述训练图像为所述无人车前方道路的拍摄图像;
基于预设的决策模型,分别获取每幅训练图像对应的驾驶信息;
利用各组训练数据对所述预设的决策模型进行迭代训练得到训练后的决策模型,其中,每组训练数据中包括一幅训练图像和所述训练图像对应的驾驶信息;
所述训练图像对应的驾驶信息包括目标驾驶动作、所述目标驾驶动作对应的环境回报值和动作图像;
所述基于预设的决策模型,分别获取每幅训练图像对应的驾驶信息,包括:
对于每幅训练图像,将所述训练图像输入到所述预设的决策模型中得到第一输出结果,所述第一输出结果包括多个候选驾驶动作、以及各个候选驾驶动作对应的第一输出值;
将所述第一输出结果中最大的第一输出值对应的候选驾驶动作确定为所述无人车的目标驾驶动作;
在所述无人车执行所述目标驾驶动作之后,获取所述无人车前方道路的拍摄图像得到动作图像,并计算所述目标驾驶动作对应的环境回报值;
所述计算所述目标驾驶动作对应的环境回报值,包括:
获取所述无人车执行所述目标驾驶动作之后的驾驶速度,并根据所述驾驶速度、预设的最小限速和预设的最大限速计算行驶回报值;
获取所述无人车执行所述目标驾驶动作之后的驾驶状态,并确定所述驾驶状态对应的预设碰撞回报值,所述驾驶状态包括碰撞和非碰撞;
根据所述目标驾驶动作计算减速回报值;
根据所述行驶回报值、所述预设碰撞回报值和所述减速回报值,计算所述目标驾驶动作对应的环境回报值。
2.如权利要求1所述的无人车驾驶决策方法,其特征在于,所述根据所述驾驶速度、预设的最小限速和预设的最大限速计算行驶回报值,包括:
通过公式计算所述行驶回报值;
其中,为所述行驶回报值,为所述无人车执行所述目标驾驶动作之后的驾驶速度,为所述最小限速,为所述最大限速。
3.如权利要求1所述的无人车驾驶决策方法,其特征在于,所述根据所述目标驾驶动作计算减速回报值,包括:
若所述目标驾驶动作是减速,则通过公式计算所述减速回报值,其中,为所述减速回报值,
若所述目标驾驶动作不是减速,则将所述减速回报值设置为第二预设值。
4.如权利要求1所述的无人车驾驶决策方法,其特征在于,在所述利用各组训练数据对所述预设的决策模型进行迭代训练得到训练后的决策模型的步骤中,进行第i次迭代训练的过程包括:
将第i组训练数据中的训练图像输入到第i-1次迭代训练后的决策模型中得到第二输出结果;
将所述第i组训练数据中的动作图像输入到参考模型中得到第三输出结果;
利用所述第二输出结果和所述第三输出结果对第i-1次迭代训练后的决策模型进行训练;
其中,当时,所述参考模型为预设的决策模型;当时,所述参考模型为第i-1次迭代训练后的决策模型;N为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911113303.3/1.html,转载请声明来源钻瓜专利网。