[发明专利]基于自然语言的工业机器人辅助编程方法有效
申请号: | 202010066644.6 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111267097B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 胡海洋;刘翰文;陈洁;李忠金;黄彬彬 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 工业 机器人 辅助 编程 方法 | ||
1.一种基于自然语言的工业机器人辅助编程方法,其特征在于,步骤如下:
步骤(1)、对输入数据进行预处理;所述的输入数据为语言指令和环境图像,通过使用带LSTM的Bi-RNN提取语言指令的特征,通过F-RCNN处理环境图像,获得目标候选区域;
步骤(2)、采用机器翻译的对齐算法,解析出环境中被语言指令确定的物体即目标物体;所述的对齐算法通过多注意力机制模型完成,多注意力机制模型包括词-物体注意力、指令-物体注意力和物体-物体注意力机制;
步骤(3)、训练多注意力机制模型,识别目标物体在环境中的位置和物体放置点参考特征;
步骤(4)、通过多注意力机制预测参照物位置,并结合语言指令特征,使用蒙特卡洛算法(MCMC)预测目标物体将要被放置的位置,并输出坐标;
步骤(5)、构建可编程逻辑控制器约束的数据库(PLC约束库)和CoBlox模块化编程;
步骤(6)、解析语言指令,使解析结果与PLC约束库和模块化的编程代码相匹配,结合步骤(4)输出的坐标生成最终的机器人辅助代码。
2.根据权利要求1所述的一种基于自然语言的工业机器人辅助编程方法,其特征在于,步骤(1)、对输入的语言指令和环境图像进行预处理;所述的预处理包括使用带有LSTM的Bi-RNN提取语言指令的语言特征和使用F-RCNN预处理环境图像,从而获得目标候选区域特征;具体步骤如下:
1.1、指令编码:将i个单词组成的指令Ii={x1,x2,x3,...,xi}输入RNN网络;通过带有LSTM的Bi-RNN对语言指令进行编码,递归生成隐藏状态序列Ii,然后通过学习函数ψx(xi)将指令映射到固定维度;
Ii=Bi_LSTM(ψx(xi),Ii-1) (1)
表示指令均值,Ii是指令的词嵌入表示;
1.2、环境编码:使用F-RCNN对环境图像进行预处理,得到全连接层获取图像候选区域特征:
表示前m个检测框的d维视觉嵌入表示;fbm是每个物体的空间和性状的特征表示,WB和a分别是物体的权重和偏差值参数;
通过一个全连接层和一个一维卷积层分别将V和I映射到相同维度:
V=relu(CONV1d(Vm)) (4)
I=relu(LINEAR(Ii)) (5)
其中V∈Rn×d是m个对象V={V1,V2,…,Vm}的集合;I∈Rd是指令的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066644.6/1.html,转载请声明来源钻瓜专利网。