[发明专利]机器学习装置、机器人系统以及机器学习方法有效
申请号: | 201711351403.0 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108202327B | 公开(公告)日: | 2020-03-13 |
发明(设计)人: | 村上贵视;青木俊道 | 申请(专利权)人: | 发那科株式会社 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;B25J19/02 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曾贤伟;范胜杰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 装置 机器人 系统 以及 学习方法 | ||
1.一种学习机器人以及激光扫描器的动作的机器学习装置,其特征在于,该机器学习装置具有:
状态观测部,其将安装有所述激光扫描器的所述机器人的末端的状态和所述激光扫描器中光学部件的状态作为状态数据来进行观测;
判定数据取得部,其将安装有所述激光扫描器的所述机器人进行的加工时间、所述激光扫描器进行处理的可处理范围的通过时间、以及以下信息中的至少一个作为判定数据来接收:驱动所述机器人的驱动电流、所述激光扫描器的指令路径以及所述机器人与所述激光扫描器进行处理的部位之间的距离;以及
学习部,其根据所述状态观测部的输出以及所述判定数据取得部的输出,学习所述机器人以及激光扫描器的动作。
2.根据权利要求1所述的机器学习装置,其特征在于,
所述状态观测部观测安装有所述激光扫描器的所述机器人的末端的位置、速度以及加速度。
3.根据权利要求1或2所述的机器学习装置,其特征在于,
所述状态观测部观测所述激光扫描器中光学部件的位置、速度以及加速度。
4.根据权利要求1或2所述的机器学习装置,其特征在于,
所述机器学习装置还具有:决策部,其根据所述学习部学习到的所述机器人以及激光扫描器的动作,决定输出给所述机器人以及所述激光扫描器的行为输出。
5.根据权利要求1或2所述的机器学习装置,其特征在于,
所述学习部具有:
回报计算部,其根据所述状态观测部的输出以及所述判定数据取得部的输出,计算回报;以及
价值函数更新部,其根据所述状态观测部的输出、所述判定数据取得部的输出以及所述回报计算部的输出,更新价值函数,该价值函数用于决定所述机器人以及激光扫描器的动作的价值。
6.根据权利要求5所述的机器学习装置,其特征在于,
所述回报计算部在所述机器人进行的加工时间长时设定负回报,在所述机器人进行的加工时间短时设定正回报。
7.根据权利要求5所述的机器学习装置,其特征在于,
所述回报计算部在所述激光扫描器的指令路径短时设定负回报,在所述激光扫描器的指令路径长时设定正回报,或者,
所述回报计算部在驱动所述机器人的驱动电流多时设定负回报,在驱动所述机器人的驱动电流少时设定正回报。
8.根据权利要求5所述的机器学习装置,其特征在于,
所述回报计算部在所述激光扫描器进行处理的可处理范围的通过时间短时设定负回报,在所述激光扫描器进行处理的可处理范围的通过时间长时设定正回报,或者,
所述回报计算部在所述机器人与所述激光扫描器进行处理的部位之间的距离长时设定负回报,在所述机器人与所述激光扫描器进行处理的部位之间的距离短时设定正回报。
9.根据权利要求1所述的机器学习装置,其特征在于,
所述机器学习装置具有神经网络。
10.根据权利要求1所述的机器学习装置,其特征在于,
所述机器学习装置被设置给各所述机器人,所述机器学习装置能够与至少一个其他机器学习装置相连接,并在所述机器学习装置与至少一个所述其他机器学习装置之间相互交换或共享机器学习的结果。
11.根据权利要求1所述的机器学习装置,其特征在于,
所述机器学习装置存在于云服务器或者雾服务器上。
12.一种机器人系统,其特征在于,具有:机器人控制装置、由所述机器人控制装置控制的所述机器人、激光扫描器控制装置、由所述激光扫描器控制装置控制的所述激光扫描器、以及权利要求1~11中任一项所述的机器学习装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于发那科株式会社,未经发那科株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711351403.0/1.html,转载请声明来源钻瓜专利网。