[发明专利]基于强化学习的复杂薄壁结构物体3D打印路径规划方法有效

专利信息
申请号: 201810784805.8 申请日: 2018-07-17
公开(公告)号: CN108995220B 公开(公告)日: 2020-04-28
发明(设计)人: 李佳奕;王祎;李凤岐;王胜法;杨德成 申请(专利权)人: 大连理工大学
主分类号: B29C64/386 分类号: B29C64/386;B33Y50/00
代理公司: 大连理工大学专利中心 21200 代理人: 梅洪玉
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于人工智能及3D打印领域,涉及一种基于强化学习的复杂薄壁结构物体3D打印路径规划方法。本发明首先建立路径规划的仿真环境,然后基于强化学习中的Q‑learning算法,建立回报矩阵R,由回报矩阵R生成状态‑动作矩阵Q;再通过对状态‑动作矩阵Q的数据进行分析,得到打印的路径规划仿真结果;最后由仿真结果,结合实际打印机参数,完成实际打印过程。本发明借助Q‑learning算法,对3D打印的路径进行智能的学习,通过学习训练,使计算机能够智能的找到适合打印的一条路径,能够大大的提高打印的效率,成形的效果也明显好于传统的路径规划算法。本发明对于复杂薄壁图形具有通用性。
搜索关键词: 基于 强化 学习 复杂 薄壁 结构 物体 打印 路径 规划 方法
【主权项】:
1.一种基于强化学习的复杂薄壁结构物体3D打印路径规划方法,其特征在于,首先建立路径规划的仿真环境,然后基于强化学习中的Q‑learning算法,建立回报矩阵R,由回报矩阵R生成状态‑动作矩阵Q;再通过对状态‑动作矩阵Q的数据进行分析,得到打印的路径规划仿真结果;最后由仿真结果,结合实际打印机参数,完成实际打印过程;具体步骤如下:第一步,建立3D打印路径规划的仿真环境根据需要打印的已知目标物体三维模型,并且目标物体三维模型被切片为K层,得到层目标物体Ci,其中,i=1,…,K;为每层的层目标物体Ci建立一个离散二维空间作为其打印仿真环境Ii;以层目标物体Ci的左下角为坐标原点O(0,0),从左下角向上建立离散的二维打印环境坐标系;横轴X和纵轴Y的刻度范围为(0,…,N),模拟打印头在打印仿真环境中最小移动距离为单位1;在打印仿真环境中,令Ci上需要打印的坐标点值为1,其他非Ci上的点代表不需要打印的点,值为0;模拟打印仿真过程是从打印仿真环境Ii中一个值为1的点出发,按照约束条件,遍历打印仿真环境中所有值为1的点;第二步,路径规划核心计算(1)建立状态‑动作矩阵Q令状态‑动作矩阵Q的行s代表打印头在目标物体上的坐标位置Is(xi,yj)的状态,动作a代表从状态s打印头当前位置Is(xi,yj)打印到目标物体上另一个坐标Ia(xp,yq)的动作,因此建立一个N×N的打印状态‑动作矩阵Q(s,a);并将状态‑动作矩阵Q中的所有元素值都进行初始化为0,如公式(1),(2)建立打印回报矩阵R,并设置打印约束条件建立一个N×N的R(s,a)回报矩阵,回报矩阵R的值表示当打印头从状态s选择动作a后的奖励值,将回报矩阵R中所有的元素首先初始化为‑1,然后加入打印约束条件:①减少打印头抬起次数约束:在打印仿真环境Ii中,已知现在状态s打印头所在位置为点(xi,yj),则考察其上下左右四临域方向的点(xi,yj‑1)、(xi,yj+1)、(xi‑1,yj)、(xi+1,yj),如果有一个点的值为1,则令打印头从当前点(xi,yj)到值为1的邻域点的动作的回报值为R(s,a)=1;②减少打印头的拐弯次数:在打印仿真环境Ii中,已知现在状态s打印头所在位置为点(xi,yj),如果当前位置上、下相邻点(xi,yj‑1)和(xi,yj+1)的和大于左、右相邻点(xi‑1,yj)和(xi+1,yj)的和,则令从当前位置到上、下相邻点动作的回报值为R(s,a)=2;如果当前位置左、右相邻点(xi‑1,yj)和(xi+1,yj)的和大于上、下相邻点(xi,yj‑1)和(xi,yj+1)的和,则分别令从当前位置到左、右相邻点对应的动作的回报值R(s,a)=2;(3)状态‑动作矩阵Q迭代学习Q‑learning状态转移方程:其中,γ为贪婪因子,0<γ<1,s表示当前状态,a表示当前动作,表示下一状态,表示下一动作;状态‑动作矩阵Q迭代学习过程如下:步骤一:设置当前状态s为初始状态;根据建立的目标物体三维模型大小设置循环次数;步骤二:在当前状态s的所有可能行为中随机选择一个行为a;步骤三:利用行为a得到下一状态步骤四:按照公式(2)进行计算,得到Q(s,a)的值;步骤五:令之后回到步骤二进行循环;(4)路径选择在3D打印路径规划中需要对路径的完全遍历,具体步骤如下:对状态‑动作矩阵Q的数据分析,进行数据的选择:步骤一:选择打印头的起始位置为状态s;步骤二:利用状态‑动作矩阵Q中状态s对应的最大值动作a,得到下一状态步骤三:令重复步骤二N次,当状态s下没有大于0的对应的动作时,对状态‑动作矩阵Q进行遍历找到一个大于0的值
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810784805.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top