[发明专利]一种移动机器人变批次长度迭代学习优化控制方法有效

申请号：	202011171545.0	申请日：	2020-10-28
公开（公告）号：	CN112318505B	公开（公告）日：	2021-11-16
发明（设计）人：	陶洪峰;庄志和;黄彦德;官上雷;胡计昶;陶新悦	申请（专利权）人：	江南大学
主分类号：	B25J9/16	分类号：	B25J9/16
代理公司：	无锡华源专利商标事务所(普通合伙) 32228	代理人：	聂启新
地址：	214122 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种移动机器人批次长度学习优化控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种移动机器人变批次长度迭代学习优化控制方法，其特征在于，所述方法包括：建立双后轮独立驱动刚性移动机器人控制系统的动态模型；构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程；利用随机变量建立批次长度随机变化模型；设计批次长度可变的迭代学习轨迹跟踪优化算法；分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性；在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法；分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性；实现批次长度可变的所述双后轮独立驱动刚性移动机器人控制系统在有输入约束情形下的轨迹跟踪；

第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型：

双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向，在固定平面内设置绝对坐标XOY，假设所述双后轮独立驱动刚性移动机器人在所述固定平面内移动，所述双后轮独立驱动刚性移动机器人的实际物理模型如下：

其中，v表示所述双后轮独立驱动刚性移动机器人的线速度，θ表示所述双后轮独立驱动刚性移动机器人的位姿角，u_r和u_l分别表示右轮和左轮的驱动控制输入，c表示黏性摩擦系数，k表示驱动增益，M₁表示所述双后轮独立驱动刚性移动机器人的质量，I_w表示车轮的转动惯量，I_v表示绕机器人重心的转动惯量，r表示车轮半径，l表示左右轮到机器人重心的距离；

第二步、构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程：

将所述双后轮独立驱动刚性移动机器人的线速度、位姿角和位姿角导数定义为状态变量：定义输入变量为驱动控制输入：u＝[u_r u_l]^T，输出变量为所述双后轮独立驱动刚性移动机器人的线速度和位姿角：y＝[v θ]^T，则式(1)所示的所述双后轮独立驱动刚性移动机器人控制系统描述为：

其中，

对连续系统模型式(2)进行离散化，选取满足香农采样定理的采样周期T_s，进一步得到所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间模型：

式中t和k分别代表采样时间和批次，批次过程的运行周期为T，且在每个重复过程周期t∈[0，T]内，取N_d个采样点；u_k(t)∈R^h，y_k(t)∈R^m和x_k(t)∈Rⁿ分别是所述双后轮独立驱动刚性移动机器人控制系统第k批次t时刻的h维输入、m维输出和n个状态向量；A，B，C为式(2)对应的离散系统参数矩阵，且满足CB≠0；并且假设系统运行的初始状态在围绕期望初始状态x_d(0)的小范围内随机变化，其数学期望满足E{x_k(0)}＝x_d(0)；

第三步、利用随机变量建立批次长度随机变化模型：

针对式(3)形式的线性离散系统，将其状态空间表达式转换为时间序列的输入输出矩阵模型：

y_k＝Gu_k+d_k (4)

其中：

u_k＝[u_k(0),u_k(1),...,u_k(N_d-1)]^T

y_k＝[y_k(1),y_k(2),...,y_k(N_d)]^T

G是时间序列上的输入输出传递矩阵，d_k是系统初始状态对输出的影响；输入Hilbert空间和输出Hilbert空间分别由如下内积及相关的诱导范数定义：

其中，分别为输入输出Hilbert空间上的向量，权矩阵R和Q为适当维数的实正定矩阵；

并且，定义期望输出y_d∈l₂[0,N_d]为：

y_d＝[y_d(1) y_d(2) … y_d(N_d)]^T (7)

传统的迭代学习控制要求批次长度固定为预期长度N_d，然而实际的运行批次长度在不同批次之间可能随机变化；记第k次迭代实际批次长度为N_k，定义实际批次长度的最小值与最大值分别为N_m和N_h；实际情况下一般将预期长度N_d设定为最大长度，即N_d＝N_h；那么实际批次长度N_k在{N_m,N_m+1,…,N_d}内随机变动，即至多存在τ_m＝N_d-N_m+1个运行批次长度；为了描述批次长度的随机性，令批次长度为N_m,N_m+1,…,N_d的概率分别为其中p_i0,1≤i≤τ_m，且

当实际批次长度N_k小于预期长度N_d时，第k批次的输出y_k在时刻t∈[N_k+1,N_d]是缺失的，不能被用于输入的更新；将缺失时刻的跟踪误差简单地设置为零，从而转化成常规情况；那么得到修正后的跟踪误差为：

修正后的跟踪误差序列为：

当N_kN_d时，e_k≠y_d-y_k，于是引入如下随机矩阵M_k来消除该不等关系：

其中表示N_k×N_k维的单位矩阵、I_m表示m×m维的单位矩阵、表示(N_d-N_k)×(N_d-N_k)维的零矩阵，表示克罗内克积，于是修正后的跟踪误差序列表示为：

对于多输出系统，当其中一个输出出现提前终止的情况，其它的输出也应同时终止，即使其它输出并未终止，其产生的输出也失去了学习的价值；所述双后轮独立驱动刚性移动机器人在预设轨迹上移动时，遇到障碍提前停止，所述线速度变为零，但所述位姿角仍在变化，然而位姿角之后的输出值失去了迭代学习的价值，因此在刻画多输出系统随机矩阵的数学期望时，看作各输出具有相同的数学期望；

为了计算所述随机矩阵M_k的数学期望，引入伯努利二元随机变量γ_k(t)来表示第k批次时刻t输出是否存在；记第k批次时刻t输出存在的概率为p(t)，则有：

由于E{γ_k(t)}＝P{γ_k(t)＝1}×1+P{γ_k(t)＝0}×0＝p(t)，则所述随机矩阵M_k的数学期望计算如下：

其中，用来简单表示随机矩阵的期望；

第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法：

将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统，给定任意初始输入及对应的跟踪误差，通过如下定义的输入信号：

得到的输入序列{u_k}_k≥0能够迭代地解决批次长度随机变化下的跟踪问题，其中，M为某一批次的随机矩阵，其定义与式(10)相同，输入信号的迭代学习控制律的前馈形式通过求解如下定义的第一性能指标函数得到：

将式(11)和式(4)先后代入所述第一性能指标函数(15)，求其二次型最优解，得：

其中根据系统初始状态的假设E{x_k(0)}＝x_d(0)可知：

E{d_k-d_k+1}＝0 (17)

将式(17)代入式(16)得：

由于对于第k+1批次的输入，第k批次的输入信号和跟踪误差已知，其期望等于其本身，又由于可逆，将式(18)整理后得到所述迭代学习控制律的前馈形式为：

u_k+1＝u_k+Le_k (19)

其中是误差项的学习增益；

第五步、分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性：

鉴于所述批次长度可变的迭代学习轨迹跟踪优化算法的特殊性，引入逐次投影思想对算法进行收敛性分析；批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入使得跟踪误差的期望收敛到零，这等价于迭代地在Hilbert空间中两个集合S₁和集合S₂的交集中寻找点集合S₁和集合S₂定义如下：

S₁＝{(e,u)∈H:e＝E{M(y_d-y)},y＝Gu+d} (20)

S₂＝{(e,u)∈H:e＝0} (21)

其中，所述集合S₁表示系统动态，所述集合S₂表示跟踪需求；假设所述集合S₁和集合S₂在Hilbert空间中存在交集，即Hilbert空间H定义如下：

Hilbert空间H包括跟踪误差及输入信号，其内积和相关的诱导范数由式(5)和式(6)导出：

其中，分别为输入输出Hilbert空间上的向量；

定义投影算子如下：

其中，x_o为Hilbert空间H上的一个点，P_S(x_o)表示x_o在集合S上的投影；

对于x_o＝(0,u)∈S₂，其在S₁上的投影为：

优化问题(26)的解为其中那么：

对投影算子采取相似的运算，对于有：

优化问题(28)的解取于是：

根据逐次投影思想，使用及x_k＝(0,u_k)分别表示对集合S₁和集合S₂第k次投影后的点，给定一个初始点x₀＝(0,u₀)∈S₂，通过式(19)进行连续投影能够得到沿迭代轴更新的输入序列{u_k}_k≥0；

设所述集合S₁和集合S₂交于一点即由于所述集合S₁和集合S₂均为Hilbert空间中的有限维闭凸集，根据逐次投影引理知，序列和{x_k}_k≥0均收敛于即：

由式(30)得：

第k+1次输入如式(14)所示，

根据所述第一性能指标函数式(15)，对于其非最优解u_k有：

由式(32)得：

E{||e_k+1||}≤E{||e_k||} (33)

即期望意义下的误差范数E{||e_k||}单调收敛至零；

另外，为了得到所述权矩阵Q和R的选取范围，将式(19)代入式(33)，并全部替换为与e_k相关的形式，得：

其中，为单位矩阵，由于每个批次的误差e_k均不相同，为了选取一组对任意批次误差均满足式(34)的所述权矩阵Q和R，需要得到一个约束条件；对式(34)两边取范数后，得其一个必要条件：

将式(35)整理得到所述权矩阵Q和R应满足的约束条件为：

第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法：

在许多工业过程控制应用中，为了确保工业过程安全、顺利地运行，需要对输入变量施加一定的约束，输入约束集Ω通常为凸集；所述输入约束集Ω一般有如下几种形式：

控制器输入的饱和约束：

Ω＝{u∈l₂[0,N_d]:|u(t)|≤Z(t),0≤t≤N_d} (37)

其中Z(t)≥0,0≤t≤N_d是随时间变化的输入幅值约束；

控制器输入的能量约束：

其中Z0是输入总能量约束；

控制器输入的震荡约束：

Ω＝{u∈l₂[0,N_d]:|Δu(t)|≤Z(t),1≤t≤N_d} (39)

其中Δu(t)＝u(t)-u(t-1)，Z(t)≥0,0≤t≤N_d是随时间变化的执行器输入震荡约束；

当出于实际需要对输入信号进行约束时，直接求取输入约束下的二次规划QP问题是困难的，于是根据逐次投影的思想设计在实际应用中更易实现的算法；

对于所述批次长度随机变化系统，给定任意满足约束的初始输入及对应的跟踪误差，先通过无约束的迭代学习控制律的前馈形式得到输入信号

再将其投影到所述输入约束集Ω：

从而得到满足输入约束的输入序列{u_k∈Ω}_k≥0能够迭代地解决批次长度随机变化下的跟踪问题；由于在实践中输入约束通常是逐点约束，因而需计算出优化问题(41)的解；当所述输入约束为饱和约束形式(37)时，对于t∈[0,N_d]，优化问题(41)的解直接由如下形式给出：

第七步、分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性：

仍然采用所述逐次投影思想对所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法进行收敛性分析；重新定义集合S₁和集合S₂如下：

S₁＝{(e,u)∈H:e＝E{M(y_d-y)},y＝Gu+d} (43)

S₂＝{(e,u)∈H:e＝0,u∈Ω} (44)

与第五步证明类似，对于x＝(0,u)∈S₂，其在S₁上的投影为：

其中是根据所述无约束的迭代学习控制律的前馈形式得到的；

对于其在S₂上的投影有：

S₂中的和是相互独立的，也就是说可以分开进行求解，于是：

其中

根据所述逐次投影思想，使用及x_k＝(0,u_k)分别表示对集合S₁和集合S₂第k次投影后的点，给定一个初始点x₀＝(0,u₀)∈S₂，通过式(40)和式(41)进行连续投影能够得到沿迭代轴更新的输入序列{u_k}_k≥0；

当存在所述输入约束时，集合S₁和集合S₂可能不存在交集，所以对所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法进行收敛性分析时，需要考虑和两种情况；

针对输入约束情况，先定义第二性能指标函数：

当时，仍然得到式(30)和式(31)；

x_k与集合S₁的最小距离为：

根据所述迭代学习控制律的前馈形式，得式(49)的优化解为：

u^*＝u_k+Le_k (50)

将式(50)代入到式(49)中，得：

同理有：

根据逐次投影引理的内容，每次投影后的抽象距离均单调减小，得到：

即所述第二性能指标函数是单调收敛的；

当时，首先定义r₁＝(e,u)∈S₁,是两集合S₁和集合S₂取最小距离时线段的两个端点，同时这也是如下优化问题的解：

式(54)等价于：

那么输入约束下的最优解为：

根据所述迭代学习控制律的前馈形式可知，式(56)内部的最小化问题的最优解为：

将式(57)代入到式(56)中，得：

式(58)中e_k前的权重I-M_kGL和L均是可逆的，那么需要最小化的性能指标是严格凸的，且所述输入约束集Ω也是凸的，因此该最小化问题具有唯一解，由此可得：

其中，a是一个正常数，d_d由期望初始状态导出：

由式(59)得知，误差范数的期望有界收敛；

根据情况下所述第二性能指标函数单调收敛的证明，同理可证明情况下所述第二性能指标函数单调收敛；

第八步、实现批次长度可变的双后轮独立驱动刚性移动机器人控制系统在有输入约束情形下的轨迹跟踪：

根据所述迭代学习控制律确定所述双后轮独立驱动刚性移动机器人控制系统每一迭代批次的输入矢量，将得到的输入矢量输入批次长度变化的双后轮独立驱动刚性移动机器人控制系统进行轨迹跟踪控制，所述双后轮独立驱动刚性移动机器人控制系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江南大学，未经江南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011171545.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

B 作业；运输

B25 手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J 机械手；装有操纵装置的容器
B25J9-00 程序控制机械手
B25J9-02 .以臂的运动为特征的，例如直角坐标型的
B25J9-06 .以多铰接爪臂为特征的
B25J9-08 .以部件结构为特征的
B25J9-10 .以机械手元件定位装置为特征的
B25J9-16 .程序控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种移动机器人变批次长度迭代学习优化控制方法有效

专利文献下载