[发明专利]一种基于Q-learning参数自适应技术的水下机器人反步速度和艏向控制方法有效
申请号: | 202010087509.X | 申请日: | 2020-02-11 |
公开(公告)号: | CN111290270B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 王卓;张佩;孙延超;秦洪德;朱仲本;张宇昂;曹禹;景锐洁 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 learning 参数 自适应 技术 水下 机器人 速度 控制 方法 | ||
1.一种基于Q-learning参数自适应技术的水下机器人反步速度和艏向控制方法,其特征在于,包括以下步骤:
基于水下机器人的运动学模型和动力学模型,利用反步法建立速度控制器和艏向控制器;
其中,ku、均为正数,为待设计的控制参数;τu为推进器纵向推力;τr为转艏力矩;x、y、z水下机器人坐标系三个轴的位置,θ、ψ分别为横滚角、俯仰角、航向角;u、v、w分别为纵向线速度、横向线速度、垂直线速度,p、q、r分别为横倾角速度、纵倾角速度、偏航角速度;|·|表示绝对值,Xu、Xu|u|、Yv、Yvv、Nr、Nr|r|均为无量纲水动力系数,Iz水下机器人绕运动坐标系z轴的转动惯量,m水下机器人的质量;ud为速度的期望值;z1=ψd-ψ、z2=α-r为艏向偏差,其中ψd为艏向的期望值,α为中间虚拟控制量;
并利用Q学习对反步法的控制参数进行优化调整:
对于速度控制器,其输入的状态向量为Su={s1u,s2u};s1u、s2u分别为eu、对应的空间转换的转换值;Q学习的输出量是速度控制器的参数k′u,k′u是需要进行划分的动作空间,从而建立速度控制器的Q值表;
对于艏向控制器,输入的状态向量为分别为对应的空间转换的转换值;为纵向速度u对应的空间转换的转换值;Q学习的输出量是艏向控制器的两个控制参数和和是需要进行划分的动作空间,从而建立艏向控制器的Q值表;
Q学习的速度控制器的输入是速度的偏差和速度的偏差变化率,经过Q学习算法,输出的是速度控制器的调整参数k′u;同样,Q学习的艏向控制器中,输入为偏航角的偏差、偏航角的偏差变化率以及水下机器人的实时速度,经过Q学习算法,最终输出的是艏向控制器的两个调整参数和
然后,依据k′u、和确定ku、
ku=ku0+k′u
其中,和是艏向控制器的两个参数的初始值;
将控制参数ku、的值代入速度控制器和艏向控制器,实现水下机器人的控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087509.X/1.html,转载请声明来源钻瓜专利网。