[发明专利]移动机器人跟踪预定轨迹的启发式动态规划控制方法有效
申请号: | 201910551319.6 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110244735B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 宋彦;张羊阳;姚琦 | 申请(专利权)人: | 安徽农业大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉 |
地址: | 230036 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种移动机器人跟踪预定轨迹的启发式动态规划控制方法,其步骤包括:1、建立大地坐标系和机器人坐标系;2、确定移动机器人的位姿信息和预瞄点位姿信息;3、计算预瞄点位置的道路曲率;4、建立移动机器人的马尔可夫决策过程模型;5、基于启发式动态规划算法设计跟踪预定轨迹的控制方法;6、推导启发式动态规划算法中执行器和评价器的在线学习规则。7、判断预瞄点是否为预定轨迹中的最后一位置坐标,若是,则控制机器人减速至预瞄点位置,若否则返回步骤2顺序进行。本发明能够在跟踪不同的预定轨迹时不需要对控制参数进行反复调试就能够获得较好的控制效果,从而能提高移动机器人的环境适应性和自主优化能力。 | ||
搜索关键词: | 移动 机器人 跟踪 预定 轨迹 启发式 动态 规划 控制 方法 | ||
【主权项】:
1.一种移动机器人跟踪预定轨迹的启发式动态规划控制方法,其特征是按如下步骤进行:第一步、以移动机器人安装的GPS传感器主天线处为坐标原点,以移动机器人前进方向为x轴,以移动机器人的前进方向逆时针旋转90度方向为y轴,建立机器人坐标系xoy;以大地质心为原点,正东方向为X轴,以正北方向为Y轴,建立大地坐标系XOY;第二步、控制移动机器人运动,并将大地坐标系下移动机器人的位姿记录存储作为预定轨迹;所述位姿信息包括位置坐标和航向角;第三步、确定当前时刻ti下移动机器人的位姿信息和预瞄点位姿信息,从而建立机器人坐标系下的轨迹跟踪误差状态方程;步骤3.1、定义(Xc(ti),Yc(ti))为移动机器人在大地坐标系XOY中当前时刻ti下的位置坐标,定义航向角φc(ti)为当前时刻ti下移动机器人纵轴线与大地坐标系X轴的夹角,定义(Xc(ti),Yc(ti),φc(ti))为移动机器人的当前时刻ti下的位姿信息;步骤3.2、设定预瞄距离为L,在预定轨迹中搜索大于预瞄距离L且距离移动机器人最近的位姿信息,并将符合要求的位姿信息定义为预瞄点Op记为(Xp(ti),Yp(ti),φp(ti));步骤3.3、定义(xe(ti),ye(ti),φe(ti))为当前时刻ti下移动机器人在机器人坐标系xoy中的位姿误差,其中xe(ti)为纵向偏差,ye(ti)为横向偏差,φe(ti)为航向角偏差,则利用式(1)建立轨迹跟踪误差状态方程:
步骤3.4、利用式(2)得到当前时刻ti下移动机器人与预瞄点Op的横向偏差的变化率
和航向角偏差的变化率![]()
式(2)中,vx(ti)为移动机器人当前时刻ti下的纵向速度,vy(ti)为移动机器人当前时刻ti下的侧向速度,ω(ti)为移动机器人当前时刻ti下的角速度,ρ(ti)为当前时刻ti下预瞄点Op处的道路曲率;第四步、计算当前时刻ti下预瞄点Op处位置的道路曲率ρ(ti);步骤4.1、从所述预定轨迹中选择三个位姿信息,包括以预瞄点Op作为第1个位姿信息、以与移动机器人的位置坐标(Xc(ti),Yc(ti))距离相同的两个位姿信息A和B作为第2个和第3个位姿信息,其中位姿信息A与位置坐标(Xc(ti),Yc(ti))的距离为L‑δ;位姿信息B与所位置坐标(Xc(ti),Yc(ti))的距离为L+δ,δ为所设定的间隔距离;步骤4.2、利用式(3)将选取的三个位姿信息进行坐标转换,从而得到当前时刻t1下在机器人坐标系xoy中任意第j个位姿信息与移动机器人的位置坐标(Xc(ti),Yc(ti))的距离分别在x轴的投影xd,j(ti)和y轴上的投影yd,j(ti)以及当前时刻ti下第j个位姿信息在机器人坐标系中的横坐标xj(ti)和纵坐标yj(ti):
式(3)中,Xj(ti),Yj(ti)为选取的预定轨迹上的经纬度坐标,Rave为地球平均半径,j=1,2,3;步骤4.3、使用三次多项式对坐标转换后的三个位姿信息的位置坐标进行曲线拟合,从而得到当前时刻ti下预瞄点Op处的道路曲率ρ(ti);第五步、建立移动机器人的马尔可夫决策过程模型:步骤5.1、定义移动机器人在当前时刻ti下的状态向量为s(ti)=(ye(ti),φe(ti),ωc(ti),ρ(ti))T,定义移动机器人在当前时刻ti下的控制动作为角速度u(ti);步骤5.2、利用式(4)计算当前时刻ti下状态向量s(t1)的回报r(s(ti)):r(s(ti))=s(ti)TQs(ti)+(u(ti)‑ωp(ti))TR(u(ti)‑ωp(ti)) (4)式(4)中,Q为半正定对角矩阵,R为一正常数,ωp(ti)为当前时刻ti下预瞄点Op处期望的角速度,且ωp(ti)=vx(ti)ρ(ti);步骤5.3、利用式(5)定义当前时刻ti下状态向量s(ti)的性能指标函数值J(s(ti)):J(s(ti))=r(s(ti),u(s(ti)))+γJ(s(ti+1)) (5)式(5)中,r(s(ti),u(s(ti)))为当前时刻ti下的立即回报值,其中s(ti)为当前时刻ti下的状态向量,u(s(ti))为当前时刻ti下移动机器人的动作,γ为折扣因子,J(s(ti+1))为下一时刻ti+1下的性能指标函数,s(ti+1)为下一时刻ti+1下的移动机器人状态向量,并由式(6)得到:
式(6)中,Ts为控制周期,且Ts=ti+1‑ti;步骤5.4、利用式(7)建立当前时刻ti下最优的控制动作u*(s(ti)):
第六步、利用式(8)计算当前时刻ti下的控制动作u(s(ti))并作为HDP算法中执行器的输出:u(s(ti))=Φa(Wa(ti)×σa(Va(ti)×s(ti)+ba1(ti))+ba2(ti)) (8)式(8)中,Va(ti)为当前时刻ti下神经网络从输入层到隐含层的第一权值,ba1(ti)为当前时刻ti下神经网络从输入层到隐含层的第一偏置,Wa(ti)为当前时刻ti下隐含层到输出层的第一权值,ba2(ti)为当前时刻ti下隐含层到输出层的第一偏置;利用式(9)计算当前时刻ti下状态向量s(ti)的性能指标函数值J(s(ti))并作为HDP算法中评价器的输出:J(s(ti))=Φc(Wc(ti)×σc(Vc(ti)×s(ti)+bc1(ti))+bc2(ti)) (9)式(9)中,Vc(ti)为当前时刻ti下神经网络从输入层到隐含层的第二权值,bc1(ti)为当前时刻ti下神经网络从输入层到隐含层的第二偏置,Wc(ti)为当前时刻ti下隐含层到输出层的第二权值,bc2(ti)为当前时刻ti下隐含层到输出层的第二偏置;第七步、建立HDP算法中执行器网络和评价器网络的在线学习规则;步骤7.1、执行器网络在线学习规则:利用式(10)建立执行器误差函数Ea(s(ti)),并将最小化执行器误差函数Ea(s(ti))作为执行器网络的学习目标:
定义中间变量ζd(ti)=u(s(ti))‑u*(s(ti)),并利用式(11)‑式(14)更新当前时刻ti下执行器网络的权值Wa(ti),Va(ti)和偏置ba1(ti),ba2(ti),从而得到下一时刻ti+1下的执行器网络的权值Wa(ti+1),Va(ti+1)和偏置ba1(ti+1),ba2(ti+1):![]()
![]()
![]()
式(11)‑式(14)中,αa为执行器网络的学习率;步骤7.2、评价器网络在线学习规则:定义中间变量为δd(s(ti))=J(s(ti))‑r(s(ti),u(s(ti)))‑γJ(s(ti+1)),并利用式(15)建立评价器误差函数Ec(s(ti)),并以最小化误差函数Ec(s(ti))作为评价器的学习目标:
利用式(16)‑式(19)更新当前时刻ti下评价器网络的权值Wc(ti),Vc(ti)和偏置bc1(ti),bc2(ti),从而得到下一时刻ti+1下的评价器网络的权值Wc(ti+1),Vc(ti+1)和偏置bc1(ti+1),bc2(ti+1):![]()
![]()
![]()
式(16)‑式(19)中,αc为评价器网络的学习率;第八步、由执行器网络得到的控制动作u(s(ti)),以及当前移动机器人的前进速度,若所述移动机器人为履带式机器人,则利用式(20)得到移动机器人两侧电机的转速nL(ti),nR(ti);若所述移动机器人为轮式机器人,则利用式(21)得到移动机器人前轮转向角:
式(20)中,rd为移动机器人的驱动轮半径,B为履带中心距,vc为移动机器人前进速度;
式(21)中,δ(ti)为前轮转向角,Lz为移动机器人轴距;第九步、判断当前时刻ti下预瞄点Op是否为预定轨迹中的最后一位置坐标,若是,则令角速度u(s(ti))=0,控制移动机器人减速并在达到预瞄点Op时停止运动;否则,将i+1赋值给i,并返回第三步顺序执行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910551319.6/,转载请声明来源钻瓜专利网。