[发明专利]一种基于Sarsa安全模型的无人自动小车的控制方法有效

专利信息
申请号: 201911139128.5 申请日: 2019-11-20
公开(公告)号: CN110941268B 公开(公告)日: 2022-09-02
发明(设计)人: 朱斐;葛洋洋;凌兴宏 申请(专利权)人: 苏州大学
主分类号: G05D1/02 分类号: G05D1/02
代理公司: 苏州翔远专利代理事务所(普通合伙) 32251 代理人: 姚惠菱
地址: 215000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 sarsa 安全 模型 无人 自动 小车 控制 方法
【权利要求书】:

1.一种基于Sarsa安全模型的无人自动小车的控制方法,其特征在于,包括如下步骤:

S1、初始化状态-动作值函数Q(x,u),其中,u∈U(x),获取步长α、回报值R、折扣因子γ、策略参数ε、权重参数β,初始化状态空间X和动作空间U,选择初始状态和初始动作;

S2将初始状态置为当前状态x,将初始动作置为当前动作u;

S3、执行当前动作u,无人自动小车进入下一状态x′并获得回报值R;

S4、对约束函数进行线性处理;

S5、用拉格朗日乘数法求解无人自动小车处于下一状态x′时可执行的下一安全最优动作u*

S6、完成Q值函数、状态空间X和动作空间U的更新;

S7、判断下状态是否为目标状态,如是,则结束本次控制,如否,则进入步骤S8;

S8、将下一状态x′置为当前状态x,将下一安全最优动作u*置为当前动作u,回到步骤S3;

Sarsa安全模型满足如下公式:

x′=f(x,u),表示无人自动小车处于当前状态x执行动作u后进入下一状态x′的概率;

Sarsa安全模型满足如下公式:

表示下一状态x′是否满足安全约束,可以由当前状态x和执行的当前动作u决定,即下一状态x′是安全的是因为无人自动小车所处的当前状态x是安全的,当前动作u是安全动作;

符号指符号左边的内容被定义为右边的内容;

采用如下公式对约束函数进行线性处理:

其中,符号≈表示左边由右边近似得到;

下标t表示无人自动小车运动的时间;

上标T表示对向量或矩阵做转置运算;

g(xt;ωi)表示以xt作为输入,输出和ut有相同维数的一个向量;

采用如下公式计算ωi

D={(xt,ut,x′t)},表示集合D由三元组(xt,ut,x′t)组成,表示智能体在当前状态xt,执行当前动作ut进入下一状态x′t,目标函数的最优解在集合D中找到;

Sarsa安全模型满足如下条件:

其中:

为目标函数;

为约束函数;

s.t.表示满足,即目标函数在优化的过程中满足约束函数;

下标t和t+1表示无人自动小车运动的时间;

i表示第i个约束;

Ci为一个常量值;

采用如下公式计算下一安全最优动作:

其中,满足的当前状态xt和当前动作ut是局部最优解,该局部最优解用梯度下降法求得,局部最优解是全局最优解;

λi是拉格朗日不定乘子,代表约束函数变化时,目标函数的变动;

所述状态为位置,所述动作为向某个方向移动;

所述无人自动小车包括控制装置、转向驱动装置以及移动驱动装置,所述控制装置为所述Sarsa安全模型。

2.如权利要求1所述的基于Sarsa安全模型的无人自动小车的控制方法,其特征在于,所述转向驱动装置和所述移动驱动装置均为伺服电机。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911139128.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top