[发明专利]一种融合多源数据及综合多维指标的自动驾驶决策方法在审
| 申请号: | 202110892416.9 | 申请日: | 2021-08-04 |
| 公开(公告)号: | CN113743469A | 公开(公告)日: | 2021-12-03 |
| 发明(设计)人: | 赵一诺;刘驰 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;B60W60/00;B60W50/00 |
| 代理公司: | 北京中海智圣知识产权代理有限公司 11282 | 代理人: | 杨树芬 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 数据 综合 多维 指标 自动 驾驶 决策 方法 | ||
1.一种融合多源数据及综合多维指标的自动驾驶决策方法,其特征在于,包括以下步骤:
步骤1、单目视觉信息处理,训练图像处理模块,将高维的图片信息处理为一维的特征向量,构建环境感知数据集,使用噪声增强驾驶策略在无人驾驶环境中采集图像数据,通过车载单目摄像头保存图像数据,使用噪声增强的驾驶策略把随机噪声引入到专家策略中并让专家策略能够收集到一些错误驾驶所对应的图像以利于驾驶策略的训练,专家策略是基于人类驾驶经验设计的一系列包含环境模型、驾驶员模型和汽车模型在内的复杂规则集合,在收集好图像信息之后,使用这些信息进行图像处理模块的自监督训练,图像处理模块使用自监督的方法把RGB图像使用一个编码器提取为一维特征向量并使用重参数技巧将一维的特征向量重构为RGB图像,通过编码器-解码器结构对环境特征进行提取,提取对于驾驶策略有用的环境信息并为驾驶策略的训练提供输入环境信息;
步骤2、多源传感数据融合,环境感知模块融合摄像头传感器、GNSS传感器、IMU传感器和速度传感器数据,共同构造环境感知信息;多源数据融合包含两部分,分别为经步骤1训练好的图像处理模块和直接接收传感器低维数据的偏移计算模块,图像处理模块用于接收RGB摄像头采集的图像,得到图像感知信息,偏移计算模块用于接收路径规划器产生的航点数据,IMU传感器信息、GNSS传感器信息和速度传感器信息,计算自车和航点之间的偏移距离和偏移角度,自车即为受本发明所述自动驾驶决策方法控制的车辆;
步骤3、多维评价指标综合,设计一个策略评估模块,对自动驾驶当前的横向控制即车辆方向的控制和纵向控制即车辆速度的控制的好坏进行实时评估,用于以下步骤5的训练,也能用于其他驾驶策略的评估,策略评估模块包含自动驾驶系统横向控制的评估、纵向控制的评估和事件评估三个部分;
步骤4、异步驾驶信息收集,使用分布式结构,在不同环境中在线收集驾驶信息并存储在驾驶信息池中,用于步骤5中的驾驶策略的训练;异步信息收集体现在每个工作进程含有独立的自动驾驶环境,各个进程间的驾驶信息收集互相独立,同时进行,通过分布式的框架,增加相同时间内产生的驾驶信息的个数与多样性以提高驾驶策略训练的效率;
步骤5、驾驶策略模块训练,将环境感知模块固定,使用分布式在线深度强化学习训练方法控制自动驾驶系统与自动驾驶环境进行交互,训练得到一个鲁棒的驾驶策略,驾驶策略模块包括长短期记忆人工神经网络、策略网络和状态价值预估网络,长短期记忆人工网络用于从前后多帧对应的环境特征向量中提取时序特征,策略网络用于输出驾驶策略即转向值、油门值、刹车值,其中转向值的范围是[-90,90],-90代表向左转90°,90代表向右转90°,油门值的范围是[0,1],0代表不踩油门,1代表油门全部踩下,刹车值的范围是[0,1],0代表不踩刹车,1代表刹车全部踩下,状态价值预估网络是对当前自动驾驶状态的好坏进行预估,驾驶策略模块根据策略评估模块给出的评估值并更新驾驶策略模块中的长短期记忆人工神经网络、策略网络和状态价值预估网络。
2.根据权利要求1所述的一种融合多源数据及综合多维指标的自动驾驶决策方法,其特征在于,所述步骤2包括以下步骤:
步骤201、从GNSS传感器得到当前自车位置(x0,y0),从路径规划器和自车位置得到距离当前自车位置最近的航点(xw,yw),从IMU传感器得到当前车辆的偏航角α;
步骤202、将全局坐标系转换为相对坐标系,以当前自车位置为原点,根据下面的公式(1)计算航点相对位置(x′w,yw):
步骤203、根据下列公式(2)计算车辆方向向量(x1,y1):
步骤204、根据下列公式(3)计算车辆偏移角度θ:
步骤205、根据车辆位置和航点位置,计算车辆偏移距离d,如以下公式(4)所示:
步骤206、综合上述结果,偏移计算模块得到度量向量(θ,d,v);
步骤207、将图像处理模块得到的特征向量和上述步骤得到的度量向量结合,环境感知模块得到t时刻的环境特征向量环境zt。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110892416.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





