[发明专利]自动驾驶的控制方法、装置、设备和计算机可读存储介质在审
申请号: | 202211093090.4 | 申请日: | 2022-09-08 |
公开(公告)号: | CN115588173A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 于鹏;孙宇;李文军 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/82;G06N3/08;G06F30/15;G06F30/27 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 郭李君;臧建明 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 驾驶 控制 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请提供一种自动驾驶的控制方法、装置、设备和计算机可读存储介质。该方法包括:获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;根据车辆的控制指令控制车辆行驶。本申请的方法,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,其中,神经网络模型和已训练的辅助训练网络模型结构类似,实现识别复杂近似的多种驾驶场景。
技术领域
本申请涉及计算机技术领域,尤其涉及一种自动驾驶的控制方法、装置、设备和计算机可读存储介质。
背景技术
汽车行业处在一个变革的时代,自动驾驶相关技术发展应用如火如荼。自动驾驶如此火热,因为它能够降低出行成本,自动驾驶发展也会促进车辆共享化从而提升车辆利用率以及降低对停车位等资源的占用成本,还能提升通行效率。
在现有的自动驾驶技术中,车辆通过图像来感知周围的环境,同时使用路况信息和地图数据作为神经网络的输入,输出车辆的控制参数,如方向盘、刹车和油门。操纵车辆执行变道、超车、停车、转弯等动作。
然而,现实交通状况非常复杂,涉及的场景十分多样,给现有的自动驾驶技术带来很大的挑战,主要表现为自动驾驶策略只能适应某一种驾驶场景。
发明内容
本申请提供一种自动驾驶的控制方法、装置、设备和计算机可读存储介质,用以解决现有技术中无法适应多种复杂近似的驾驶场景的问题。
本申请一实施例提供一种自动驾驶的控制方法,包括:
获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;
根据车辆的控制指令控制车辆行驶;
其中,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,且在训练过程中已训练的辅助训练网络模型内参数不变。
在一实施例中,控制方法还包括:
获取车辆在仿真环境采集到的第一仿真图像数据,
将第一仿真图像数据输入到神经网络模型和已训练的辅助训练网络模型中,获得第一仿真图像对应的多个车辆控制动作的概率;
根据第一仿真图像对应的多个车辆控制动作的概率从多个车辆控制动作中选择一个目标车辆动作;
获取车辆在执行目标车辆动作后的第二仿真图像数据,并生成一个奖励值;
将第一仿真图像数据、第二仿真图像数据、奖励值以及目标车辆动作作为一组训练数据;其中,训练数据用于训练神经网络。
在一实施例中,控制方法还包括:
待获取到预设数量组的训练数据时,使用多组训练数据对神经网络模型、已训练的辅助训练网络模型以及测试网络模型进行多轮训练,获得已训练的神经网络模型;
其中,在每个训练循环中,将一组训练数据中第一仿真图像数据和目标车辆动作输入神经网络模型和已训练的辅助训练网络模型,将第二仿真图像数据输入测试网络模型中;
根据神经网络模型内参数、已训练的辅助训练网络模型内参数、测试网络模型中参数、神经网络模型输出的不同车辆控制动作的概率值以及测试网络模型输出的不同车辆控制动作的概率值,计算损失值和更新神经网络模型内参数,当损失值小于预设阈值时停止训练;
其中,测试网络模型与神经网络模型和已训练的辅助训练网络模型构成的混合模型相同。
在一实施例中,控制方法还包括:
每隔预设轮数的训练,使测试网络模型中参数与神经网络模型和已训练的辅助训练网络模型构成的混合模型中相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211093090.4/2.html,转载请声明来源钻瓜专利网。