首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种融合深度强化学习的自主换道方法及系统有效

申请号：	202111114372.3	申请日：	2021-09-23
公开（公告）号：	CN113682312B	公开（公告）日：	2023-07-25
发明（设计）人：	丁华杰;卜祥津;张飞	申请（专利权）人：	中汽创智科技有限公司
主分类号：	B60W30/18	分类号：	B60W30/18;B60W40/00;B60W40/105;G06N3/0464;G06N3/08
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;贾允
地址：	211100 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种融合深度强化学习自主方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种融合深度强化学习的自主换道方法，其特征在于，包括：

在训练环境中训练深度强化学习模型，得到并保存所述深度强化学习模型的训练参数；所述深度强化学习模型采用Actor-Critic算法；

在所述训练环境中，添加按照基于规则的自动驾驶策略行驶的目标车辆的信息；

根据所述训练环境和所述基于规则的自动驾驶策略制定评价函数；确定所述评价函数的公式为：

其中，、、、为相关系数，为纵向加速度，为横向加速度，、为前后车辆与目标车辆的相对时差、相对距离或相对速度；

根据所述评价函数，判断所述目标车辆的信息是否满足仲裁条件；

若满足所述仲裁条件，则将所述训练参数融合到所述目标车辆的信息，得到所述目标车辆的方向盘转角和车速并输出，以控制所述目标车辆行驶；

若不满足所述仲裁条件，则仍按照所述基于规则的自动驾驶策略，得到并输出所述目标车辆的方向盘转角和车速，以控制所述目标车辆行驶。

2.根据权利要求1所述的一种融合深度强化学习的自主换道方法，其特征在于，所述深度强化学习模型基于深度学习网络搭建而成，所述深度学习网络为包括四层卷积层和两层全连接层的卷积神经网络，用于提取所述训练环境中的特征。

3.根据权利要求2所述的一种融合深度强化学习的自主换道方法，其特征在于，所述深度强化学习模型包括模型策略函数和模型评价函数，通过对所述模型策略函数和所述模型评价函数进行梯度下降，使得所述训练参数不断收敛，完成所述深度强化学习模型的训练；

所述深度学习网络对所述模型策略函数进行梯度下降的公式为：

其中，为所述卷积神经网络的参数，为评价策略梯度更新的优势函数，代表矩阵，表征训练动作；

所述深度学习网络对所述模型评价函数进行梯度下降的公式为：

其中，为奖惩值，为贪婪系数，为状态价值函数。

4.根据权利要求3所述的一种融合深度强化学习的自主换道方法，其特征在于，所述在训练环境中训练深度强化学习模型，得到并保存所述深度强化学习模型的训练参数包括：

获取周围环境信息；

将获取的所述周围环境信息压入矩阵，以得到所述目标车辆所处的当前状态；所述当前状态至少包括所述目标车辆的车速的信息和方向盘转角的信息；

将所述当前状态压入数组以表征一个训练动作；

所述目标车辆执行所述训练动作，以进入下一个训练状态；

将所述训练状态作为一个变量，重新返回压入矩阵的步骤，使得所述当前状态不断更新；

当所述当前状态能够满足所述目标车辆在所述训练环境中进行车道保持和自主避障行驶后，将所述当前状态作为最优的所述训练参数保存。

5.根据权利要求1所述的一种融合深度强化学习的自主换道方法，其特征在于，所述基于规则的自动驾驶策略包括：

在所述训练环境中，获取周围环境信息中交通参与者的规则化信息；所述规则化信息至少包括车道线方程、周围车辆信息和限速标识；

根据所述周围车辆信息和所述限速标识，决策所述目标车辆的实时车速，并控制所述目标车辆按照所述实时车速进行行驶；

根据所述车道线方程，控制所述车辆的方向盘跟随规划轨迹进行行驶。

6.根据权利要求5所述的一种融合深度强化学习的自主换道方法，其特征在于，所述基于规则的自动驾驶策略还包括：

当出现自主换道需求时，获取相邻车道信息；

根据所述相邻车道信息，判断是否满足换道条件；

若判断结果为满足换道条件，则规划一条从本车道到目标车道的换道轨迹，并控制所述目标车辆跟随所述换道轨迹进行换道。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中汽创智科技有限公司，未经中汽创智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111114372.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种便携式可载人电动智能爬杆机器
下一篇：一种氧化石墨烯-磁性纳米粒子-污泥复合吸附剂及其制备方法和应用

同类专利

专利分类

B 作业；运输

B60 一般车辆
B60W 不同类型或不同功能的车辆子系统的联合控制；专门适用于混合动力车辆的控制系统；不与某一特定子系统的控制相关联的道路车辆驾驶控制系统
B60W30-00 不与某一特定子系统的控制
B60W30-02 .车辆驾驶稳定性的控制
B60W30-06 .用于驻车的自动操作
B60W30-08 .预测或避免可能的或即将到来的碰撞的
B60W30-10 .路线保持
B60W30-14 .巡航控制

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top