[发明专利]基于机器人操作技能获得的弱刚度零部件装配系统及方法有效
申请号: | 201910533739.1 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110253577B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 宋锐;李凤鸣;李贻斌;马昕 | 申请(专利权)人: | 山东大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器人 操作技能 获得 刚度 零部件 装配 系统 方法 | ||
1.一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,包括:
视觉图像采集部,其被配置为采集当前装配图像;
末端力检测部,其被配置为采集装配对象相互作用时的接触力/力矩;
控制部,其被配置为:
接收当前装配图像及装配对象相互作用时的接触力/力矩并进行信息融合;
从融合信息中提取装配状态特征,并作为操作技能学习网络的输入;
根据预设回报评价函数的反馈值来训练操作技能学习网络,输出决策指令至装配动作执行部;其中,
训练操作技能学习网络包括:将采样样本中下一状态特征矩阵作为主网络和目标网络的输入向量,分别输出Q值对应的机械臂动作列表,主网络的输出动作为:表示Q函数值最大时对应的动作a值;依赖贝尔曼方程,表示主网络的参数,s表示装配状态,R表示累积回报;
利用主网络输出动作对应的索引值对目标网络输出的机械臂动作列表进行选择,得到目标网络对应的机械臂动作,从而生成目标网络值为:
其中,表示目标网络的参数,st+1和rt+1分别表示下一个时刻的装配状态和回报值,表示主网络的输出动作值,γ∈[0,1]是折扣因子;
将采样样本中当前装配状态特征矩阵输入到主网络中,输出对应的机械臂动作,生成当前预测网络值;
根据目标网络值和当前预测网络值得到机器人操作技能学习网络的目标损失函数,优化损失函数,得到网络最优权值;
装配动作执行部,其被配置响应决策指令并执行相应装配动作。
2.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,当前装配图像及装配对象相互作用时的接触力/力矩进行信息融合之前还包括:
对装配图像进行深度卷积网络特征提取处理。
3.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,当前装配图像及装配对象相互作用时的接触力/力矩进行信息融合之前还包括:
对装配对象相互作用时的接触力/力矩进行滤波预处理。
4.如权利要求3所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,采用高斯滤波对装配对象相互作用时的接触力/力矩进行滤波预处理。
5.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,根据预设回报评价函数的反馈值来训练操作技能学习网络之后,还包括测试训练好的操作技能学习网络,其过程为:
随机设定初始装配状态;
获取当前经过融合处理后的装配状态特征;
输入到已训练好的操作技能学习网络中,输出决策指令至装配动作执行部;
根据装配动作执行部执行的相应装配动作后图像来判断装配是否成功,若是,则结束,否则继续获取当前经过融合处理后的装配状态特征,根据当前装配状态进行调整决策指令。
6.如权利要求5所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,根据装配动作执行部执行的相应装配动作后图像来判断装配是否成功的过程为:
建立装配成功状态的图像模板库;
获取装配最终状态的图像,采用相关系数法与模板库进行匹配;
若装配状态与模板匹配成功,则设置参数n=1,否则n=0。
7.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,在所述控制部中,操作技能网络结构包含4个卷积网络和2个全连接层,其中2个全连接层构成竞争架构。
8.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,所述视觉图像采集部为深度相机。
9.如权利要求1所述的一种基于机器人操作技能获得的弱刚度零部件装配系统,其特征在于,所述末端力检测部为六维力传感器,装配动作执行部为六轴机械臂。
10.一种如权利要求1-9中任一项所述的基于机器人操作技能获得的弱刚度零部件装配系统的装配方法,其特征在于,该方法在控制部内完成,包括:
接收当前装配图像及装配对象相互作用时的接触力/力矩并进行信息融合;
从融合信息中提取装配状态特征,并作为操作技能学习网络的输入;
根据预设回报评价函数的反馈值来训练操作技能学习网络,输出决策指令至装配动作执行部,由装配动作执行部响应决策指令并执行相应装配动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910533739.1/1.html,转载请声明来源钻瓜专利网。