[发明专利]基于强化学习-非支配排序遗传算法的作业车间调度方法在审
申请号: | 202210641631.6 | 申请日: | 2022-06-08 |
公开(公告)号: | CN115310654A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 葛江华;李狄威;朱晓飞 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/04;G06N3/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 支配 排序 遗传 算法 作业 车间 调度 方法 | ||
本发明涉及柔性作业车间调度技术领域,具体涉及一种基于改进非支配遗传算法和强化学习的柔性作业车间多目标调度方法。因为非支配排序遗传算法在求解柔性作业车间多目标优化调度问题中具有多样性不足、易于早熟与局部收敛的缺点,而因为强化学习试错学习的性质,它的探索机制可以极大地解决非支配排序遗传算法多样性不足等缺点。为实现以上目的,本发明提出一种基于改进遗传算法和强化学习的柔性作业车间多目标调度方法。
技术领域
本发明涉及柔性作业车间调度技术领域,具体涉及一种基于改进遗传算法和强化学习的柔性作业车间多目标调度方法。
背景技术
柔性作业车间调度问题(FJSP)是传统作业车间调度问题(JSP)的拓展。与传统作业车间调度问题不同的是,FJSP中的每一道工序均可以在其匹配机器中得任意一条机器上加工,而不是智能在固定机器上加工。由于机器分配存在柔性,所以FJSP比JSP更复杂,求解难度更高。因此对柔性作业插件调度问题的研究是近十年工业界关注的一个重点问题。
精确算法和近似算法是解决调度问题的两种主要方式。精确算法主要包括整数规划方法、拉格朗日松弛法、分支定界法等算法。精确算法的优势是能够得到全局最优解,但是求解的复杂性很大,所以只能对小规模算例得到近似最优解。近似解法包括专家系统,启发式算法等,近似算法可以很快得到较优的解,但是不能保证得到最优解。因此启发式算法成为大规模问题的较优解决算法。非支配排序遗传算法NSGA-II,(Non-dominated sortinggenetic algorithm II)是一种受到广泛应用的多目标遗传算法。它通过交叉变异来广泛搜索最优解,通过帕累托解集来权衡几个优化目标在最终结果所占的权重,使得柔性作业车间问题得到解决,因此在业界被广泛应用。
但是非支配排序遗传算法在求解柔性作业车间多目标优化调度问题中多样性不足、易于早熟与局部收敛的缺点需要解决。而强化学习具有试错学习的性质,它在运行的时候会广泛搜索遗传算子的所有取值可能性,它的探索机制可以极大地解决非支配排序遗传算法多样性不足等缺点。
发明内容
针对现有技术的不足,本发明提供了一种基于改进遗传算法和强化学习的柔性作业车间调度方法,该方法可以利用非支配排序遗传算法得出可行解,并利用强化学习的试错性质广泛的搜索遗传算自的所有取值可能性,解决了现有技术在求解柔性作业车间多目标优化调度问题中多样性不足、易于早熟与局部收敛的缺点。所述方法包括(如图6):
步骤1:初始化车间模型,输入工件信息。
步骤2:初始化染色体。
步骤3:初始化遗传算法,形成染色体种群,计算初始种群中解间距值与熵度量值。
步骤4:对种群进行快速非支配排序和拥挤度的计算。
步骤5:对于排序后的种群按照比例参数β拆分成两个子种群,对两个子种群采用不同的交叉变异策略获得下一代种群。
步骤6:计算当前次数是否大于迭代次数G,否的话执行步骤7,否则执行步骤10。
步骤7:计算种群中解间距值与熵度量值这次循环的交叉概率Pc一起作为状态值st输入强化学习算法。
步骤8:计算奖励值Rt,根据ε-贪心策略选择动作at,更新强化学习参数
步骤9:根据动作at改变比例参数β和交叉概率Pc,执行步骤4。
步骤10:算法执行结束,输出最优解以及最优解对应的甘特图。
综上所述,与现有技术相比,具备以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210641631.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多缸水冷发电机的消音机构
- 下一篇:一种市政污水管网用污水净化处理装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理