[发明专利]一种基于多模信息描述的柔性装配系统及方法有效
申请号: | 201811454906.5 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109543823B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 宋锐;李凤鸣;李贻斌;邹永显;权威;张思思;魏猛 | 申请(专利权)人: | 山东大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;B23P21/00;B23P19/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 描述 柔性 装配 系统 方法 | ||
1.一种基于多模信息描述的柔性装配方法,其特征是,包括:
S1:在机械臂末端零部件与待装配零部件未接触阶段,通过视觉引导将机械臂快速定位在目标位置附近,实现视觉引导粗定位;
S2:当机械臂末端零部件与待装配零部件接触后,借助力觉信息和机械臂自身的参数,形成装配状态的多模信息描述,基于深度强化学习方法进行姿态调整,实现装配零部件的力觉感知精装配;
所述S2具体包括:
通过机械臂的关节传感器采集装配过程中的关节角度及角速度,并根据机械臂正运动学解算出末端执行器位姿,以及装配零部件接触时的力/力矩信息,构建包含关节角度及角速度、位姿、力/力矩信息的装配状态矩阵;
将装配状态矩阵输入到已经训练好的深度强化学习模型进行姿态调整,其中,建立深度强化学习模型,包括:
构建基于深度强化学习的网络模型,策略网络和Q值网络结构均采用三层全连接网络,激活函数设为sigmoid函数;
建立装配质量评价回报函数;
训练建立好的网络模型,在训练建立好的网络模型时,基于装配质量评价回报函数,采用反向传播算法求解当前策略网络的梯度,获得状态-动作Q值;
测试训练好的网络模型,根据当前装配状态进行机械臂动作调整,直至装配成功;
保存网络模型;
所述装配质量评价回报函数
其中,fz为z轴受力,f0为阻尼阈值,l为装配深度,z0为初始位置距装配目标表面的距离,z表示z轴上的位移距离;
则T时间段内的累积回报为
γi-1表示折扣因子,st表示t时刻的状态,at表示t时刻机械臂将要执行的动作,rt(st,at)表示在t时刻机械臂得到的即时奖励。
2.如权利要求1所述的一种基于多模信息描述的柔性装配方法,其特征是,在机械臂末端零部件与待装配零部件未接触阶段,通过相机采集装配零部件的图像,进行图像特征提取并进行目标位姿解算,根据解算的位姿引导机械臂至装配零部件附近。
3.如权利要求1所述的一种基于多模信息描述的柔性装配方法,其特征是,根据机械臂末端夹具上的上力传感器信息判断机械臂末端零部件与待装配零部件是否接触。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811454906.5/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置