[发明专利]基于动态运动原语和自适应控制的机械臂模仿学习方法有效
申请号: | 202111274511.9 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113977580B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 张文安;高伟展;刘安东;付明磊;徐建明;杨旭升 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 汤明 |
地址: | 310014 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 运动 自适应 控制 机械 模仿 学习方法 | ||
1.基于动态运动原语和自适应控制的机械臂模仿学习方法,其特征在于,包括以下步骤:
1)拖动示教:通过拖动机械臂完成所需的任务,在拖动的过程中记录机械臂关节位置、速度、加速度和机械臂外部负载力矩,通过重复Nd次该示教过程,得到示教动作的数据集;
2)动作建模:得到多次示教的动作数据集后,对轨迹特征和负载力矩特征进行建模,用于生成动作序列控制机械臂复现动作;
3)动作泛化:考虑到动作需要泛化,在得到模型后,通过参数来调整生成动作的轨迹,泛化出所需的动作;然后通过泛化后的模型生成位置、速度、加速度和负载力矩控制量,同时机械臂反馈位置、速度和力矩到动态运动原语模型中,用于生成下一周期的动作序列;
4)动作复现,通过自适应神经网络控制器控制机械臂复现建模的动作;
所述的步骤2)具体为:
2.1)将示教动作数据分离为轨迹特征和负载力矩特征;
2.2)通过引入高斯混合模型和高斯混合回归的动态运动原语对轨迹特征进行建模;
2.3)通过结合径向基神经网络的动态运动原语对负载力矩特征进行建模;
所述步骤2)中:针对示教数据中的轨迹特征,将高斯混合模型和高斯混合回归应用于动态运动原语中,从而使动态运动原语能从多组示教轨迹中建模轨迹特征,其建模过程如下:
a)对于采集的多组示教轨迹数据集其中θk,n、分别是k时刻的位置、速度、加速度,通过动态运动原语模型从示教轨迹数据集中得到强迫项数据集{(xk,fk,n)|k=1,2,…,T;n=1,2,…,Nd},其中xk为系统上的等时间间隔采样,τs为系统的相位参数用于控制系统状态的持续时间,T和Nd分别为单条轨迹的最大采样次数和示教轨迹条数,αz和βz为正常数,通常选取βz=αz/4使得系统达到临界阻尼,x为相位系统的状态,αx用于调节相位系统的收敛速度;
模型联合概率密度函数定义如下:
其中,μx,k和μf,k是第k个高斯分布的相位和强迫项均值,Σx,k、Σxf,k、Σfx,k、Σf,k是第k个高斯分布的相位与强迫项的方差以及其之间的协方差,是高斯概率分布,αk≥0是权重,K是高斯基的总个数,和表示的是第K个高斯基分布的均值和方差;为获得初始高斯混合模型参数,对数据集进行K-means聚类,即其中,x=[xk,fk,n]T,mk是集合Dk的均值,把数据集分成K个部分D={D1,D2,…,Dk}后,初始参数为μk=mk,Di为第i个部分所有点的集合;
c)通过EM算法求取最优参数πk=(αk,μk,Σk),得到最终的高斯混合模型;
d)通过高斯混合回归估计真实的f(x),即其中为由数据集中获取的均值和方差组成的高斯分布,然后在等时间间隔选取高斯基中心位置的情况下,利用局部线性回归求取动态运动原语高斯基权重,即可得到动态运动原语参数模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111274511.9/1.html,转载请声明来源钻瓜专利网。