[发明专利]一种基于深度强化学习的铣削参数优化方法有效
申请号: | 202111396317.8 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114200889B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 李斌;李伟业;贺松平;毛新勇;刘红奇;赵尊元 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G05B19/408 | 分类号: | G05B19/408 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 刘洋洋 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 铣削 参数 优化 方法 | ||
1.一种基于深度强化学习的铣削参数优化方法,其特征在于,所述方法包括:
S1:采用BPNN回归方法构建以铣削参数为输入并以铣削功率为输出的BPNN功耗模型;
S2:根据BPNN功耗模型输出的铣削功率构建加工成本模型;
S3:构建以迭代过程中铣削参数和加工成本为参数的状态函数、待优化铣削参数的动作参数范围、以上次迭代加工成本与本次迭代加工成本为参数的奖励函数,以及迭代过程中的约束条件;
S4:构建仿真环境模型,所述仿真环境模型包括所述BPNN功耗模型、加工成本模型、奖励函数以及状态函数,所述BPNN功耗模型根据铣削参数输出铣削功率,加工成本模型根据铣削功率获取本次迭代加工成本并将其输入奖励函数得到奖励值,根据奖励值判断是否结束任务;
S5:将所述仿真环境模型与TD3模型进行耦合得到BP-TD3模型,以使的所述TD3模型根据所述仿真环境模型的观测状态在所述动作参数范围内选择铣削参数;
S6:以最小化加工成本为目标对所述BP-TD3模型进行训练,将待优化铣削参数输入训练好的BP-TD3模型即可获得优化后的铣削参数。
2.根据权利要求1所述的方法,其特征在于,所述加工成本模型包括:
其中,cost为加工成本,SEC为能源成本,Tp为加工时间成本,λ1和λ2为平衡因子,Pcutting为机床的铣削功率,MRR为材料的去除率,ψ为时间成本因子,Lc为铣削长度,fc为铣削进给速度,MRR=ap·ae·fc,ap为铣削深度,ae为铣削宽度。
3.根据权利要求1所述的方法,其特征在于,步骤S3中所述状态函数st为:
st=[ap(t),ae(t),n(t),fc(t),Cost(t),Done(t)]
其中,t为第t次优化迭代,ap(t)为第t次优化迭代对应的铣削深度,ae(t)为第t层次优化迭代对应的铣削宽度,n(t)为第t次优化迭代时的主轴转速,fc(t)为第t次优化迭代时的进给速度,Cost(t)为第t次优化迭代时的加工成本,Done(t)第t次优化迭代时的布尔变量;
动作参数范围at为:
at=[n(t),fc(t)]
其中,[n(t),fc(t)]表示二元向量;
奖励函数rt为:
rt=Cost(t-1)-Cost(t)
约束条件为:
其中,τi(t)表示第i个优化任务的第t次优化迭代;xmin和xmax是铣削参数(ap,ae,n,fc)的上下边界,Pr为机床额定功率,η为相应的效应因子,j=1,2,3。
4.根据权利要求3所述的方法,其特征在于,步骤S4中若奖励函数的奖励值小于0则结束该幕优化并赋值Done(t)=1,反之则继续优化并赋值Done(t)=0。
5.根据权利要求1所述的方法,其特征在于,所述铣削参数和铣削功率通过对机床进行正交实验获得。
6.根据权利要求1或5所述的方法,其特征在于,通过以下步骤获得所述铣削参数和铣削功率:
S11:根据铣削参数范围设计正交实验表,按照正交实验表在机床上进行铣削实验,采集铣削过程中的机床主轴伺服电流和进给轴伺服电流;
S12:将所述机床主轴伺服电流和进给轴伺服电流转化为铣削功率,进而建立铣削参数对应的铣削功率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111396317.8/1.html,转载请声明来源钻瓜专利网。