[发明专利]一种基于模糊奖励的无人驾驶车辆轨迹生成方法有效

申请号：	201711374968.0	申请日：	2017-12-19
公开（公告）号：	CN108229730B	公开（公告）日：	2021-07-20
发明（设计）人：	王祝萍;邢文治;张皓;陈启军	申请（专利权）人：	同济大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G05D1/02
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	赵志远
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模糊奖励无人驾驶车辆轨迹生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于模糊奖励的无人驾驶车辆轨迹生成方法，包括以下步骤：1)获取多条示教车辆的轨迹信息，并统计轨迹信息中轨迹特征的特征期望；2)在无人驾驶车辆运行过程中，根据特征期望获取当前空间状态下的奖励值；3)根据每个空间状态下的奖励值在空间中选择轨迹点坐标，拟合后形成最终的无人驾驶车辆的车辆轨迹。与现有技术相比，本发明具有规律统计、具有健壮的迁移能力、简单易操作、贴近示教、适用于小数据集等优点。

技术领域

本发明涉及无人车辆驾驶决策领域，尤其是涉及一种基于模糊奖励的无人驾驶车辆轨迹生成方法。

背景技术

无人驾驶汽车是具有自主行驶能力移动机器人的一种高级形态。它是能够实现环境感知、决策规划与运动控制三大功能于一体的智能计算系统。系统相对其它小型移动机器人来说，结构比较复杂。除了基本的移动行驶能力外，具有运用雷达、摄像头等各种传感器配合特制的高精度地图进行即时的数据融合与定位，实现对当前环境的感知理解。同时，根据感知器理解的道路和运动障碍物信息，车辆运用决策规划算法切出合理可行的预期轨迹，由控制模块进行最终的车辆移动行为实施。整个智能计算系统包括了车道线检测、障碍物识别、高精度地图、高精度定位、决策规划算法和控制器设计等重要的关键技术，涉及众多学科知识，具有极高的理论研究意义与工程实践价值。

无人驾驶车辆研究的领域包括环境感知、行为决策、规划控制三大方向。其中，行为决策作为连接环境感知与规划控制的中枢位置，具有十分重要的地位，已经成为无人驾驶领域研究的重点和难点。行为决策是在当前环境下可选的几种可行性方案中挑选出符合自身行为目的的最佳方案过程。在这个过程中，往往需要特定的决策算法对采取行为之后的结果状态进行预测评价，力求在统一判断标准下做到选取最佳的行为。对于无人驾驶车辆而言，行为决策需要根据当前雷达、摄像头等传感器融合的数据信息获取对外部环境的感知理解，对车辆即将执行的下一个行为进行合理的预测，并根据决策算法将可选的行为以物理值的形式传递给规划控制系统，进一步实现决策模块的期望行为，以实现车辆的无人操作自主驾驶。

行为决策理论最早出现在心理学、管理学、经济学领域，后来逐渐拓展应用于其他方向。当前，关于车辆的行为决策主要集中于有限状态机、决策树、多属性决策等传统的经验方法和基于学习的预测方法。基于经验的设计方法不能拓展至综合复杂的场景，却有着很高的稳定性；基于学习预测的方法虽然对行为有着难以确定的稳定性与安全性，不过对场景的适应能力要远优于基于经验的设计方法。从无人驾驶的发展来看，必然面临场景的复杂性与多变性这一问题，而现有方法中却没有有效解决该问题的手段。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于模糊奖励的无人驾驶车辆轨迹生成方法。

本发明的目的可以通过以下技术方案来实现：

一种基于模糊奖励的无人驾驶车辆轨迹生成方法，包括以下步骤：

1)获取多条示教车辆的轨迹信息，并统计轨迹信息中轨迹特征的特征期望；

2)在无人驾驶车辆运行过程中，根据特征期望获取当前空间状态下的奖励值；

3)根据每个空间状态下的奖励值在空间中选择轨迹点坐标，拟合后形成最终的无人驾驶车辆的车辆轨迹。

所述的步骤1)中，轨迹特征为车辆与最左车道线距离、车辆与最右车道线距离、车辆与左边障碍物距离、车辆与右边障碍物距离、车辆与正前方障碍物距离、车辆与正后方障碍物距离和/或车辆自身车速。

所述的步骤2)具体包括以下步骤：

21)计算当前状态下所有轨迹特征的递减程度函数；

22)根据递减程度函数计算轨迹特征对应的奖励；

23)对特征对应的奖励进行求和得到车辆在该状态下的奖励值。