[发明专利]一种获取多维随机分布及强化控制器的方法和装置有效

专利信息
申请号: 201711091328.9 申请日: 2017-11-08
公开(公告)号: CN109752952B 公开(公告)日: 2022-05-13
发明(设计)人: 陈晨;钱俊 申请(专利权)人: 华为技术有限公司
主分类号: G05B13/04 分类号: G05B13/04;G05D1/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 获取 多维 随机 分布 强化 控制器 方法 装置
【说明书】:

一种获取多维随机分布的方法,所述多维随机分布用于强化控制器模型,该方法包括:获取历史驾驶数据,所述历史驾驶数据包括执行目标基本动作的底层控制指令;处理所述历史驾驶数据得到多个控制指令样本,所述多个控制指令样本中每一控制指令样本为由具有时序的底层控制指令构成的用于执行所述目标基本动作的控制指令序列;根据所述多个控制指令样本得到平均控制指令,所述平均控制指令用于指示由控制值处于平均水平且具有时序的底层控制指令构成的用于执行所述目标基本动作的控制指令序列;根据所述平均控制指令和所述多个控制指令样本得到多维随机分布,所述多维随机分布为围绕所述平均控制指令在一定范围内扰动的期望函数分布。

技术领域

本申请涉及汽车自动驾驶领域,尤其涉及一种无人驾驶控制的方法和装置。

背景技术

在汽车自动驾驶领域,如何让无人车像人类司机一样执行一些基本动作面临巨大的挑战,例如沿着道路轴线直行、换道、超车、跟车、泊车等基本动作,控制无人车执行基本动作的任务在无人车规划控制领域称为motion planner。

由于现实中的道路情况复杂多变,而底层控制指令又需要非常精细,如何满足安全需求、具备灵活的路况应变能力且能保证平稳舒适性地完成motion planner是技术难点所在。现有技术可以归类为以下三种:基于规则的行为决策,基于约束的方案,基于学习的方案,目前上述三种现有技术存在局限性,不能很好地完成motion planner。基于规则的行为决策的技术方案一般假设道路上其他车都是匀速的情况下基于规则设计控制指令,当面对复杂路况时无法灵活应对,应用场景比较单一。基于约束的技术方案,例如一种基于状态空间与最优化的方法,通常需要车辆与周围环境的精准模型,而这种精准模型在实际中很难获取且非常复杂;如果使用近似模型,又会由于模型本身存在误差与不确定性,导致技术方案的效果有限。

基于学习的技术方案,特别是强化学习,大部分是针对高层决策,决策什么时机执行什么任务,用于生成底层的控制指令非常有限,因为缺少可以提高模型收敛速度的随机分布用于自由探索且训练难度极大,稳健性很差。

发明内容

为了解决现有技术存在的技术问题,本申请提供了一种获取多维随机分布的方法及强化学习。

第一方面,本申请提供了一种获取多维随机分布的方法,所述多维随机分布用于强化控制器模型,其特征在于,包括:获取历史驾驶数据,所述历史驾驶数据包括执行目标基本动作的底层控制指令,所述目标基本动作为变道、超车、跟车、泊车、沿道路轴线直行中的任一个,所述底层控制指令包括加速度参数、转角参数、刹车参数中一个或多个;处理所述历史驾驶数据得到多个控制指令样本,所述多个控制指令样本中每一控制指令样本为由具有时序的底层控制指令构成的用于执行所述目标基本动作的控制指令序列;根据所述多个控制指令样本得到平均控制指令,所述平均控制指令用于指示由控制值处于平均水平且具有时序的底层控制指令构成的用于执行所述目标基本动作的控制指令序列,其中,平均控制指令的控制值通过计算所有控制指令样本对应的底层控制指令的控制值的平均值得到,例如:5个控制指令样本的第一个时序的底层控制指令的控制值分别为:5、3、3、5、4,求的平均值为4,那么平均控制指令的第一时序的底层控制指令为4;根据所述平均控制指令和所述多个控制指令样本得到多维随机分布,所述多维随机分布为围绕所述平均控制指令在一定范围内扰动的期望函数分布。可选的,历史驾驶数据可以在车辆驾驶过程中获取,也可以在模拟驾驶过程中获取,也可以从公开数据源或第三方获取历史驾驶数据。根据历史驾驶数据得到的多维随机分布,作为自由探索策略用于强化控制器模型,符合人类学习的直觉,并且可以减少训练控制器模型过程中的探索空间从而提高控制器模型的收敛速度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711091328.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top