[发明专利]基于Alpha Zero以及结合启发式策略的自动排料方法在审

申请号：	201910924758.7	申请日：	2019-09-27
公开（公告）号：	CN110751319A	公开（公告）日：	2020-02-04
发明（设计）人：	宋艳枝;邱安东	申请（专利权）人：	合肥黎曼信息科技有限公司
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/04;G06N3/04;G06N3/08
代理公司：	31253 上海精晟知识产权代理有限公司	代理人：	孙永智
地址：	230000 安徽省合肥市合肥高新技术开发***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了基于Alpha Zero以及结合启发式策略的自动排料方法，涉及工业生产的排料技术领域。本发明包括选取启发式策略、选择比较优势机制、选择训练方式和网络模型、模型训练以及自动排料。本发明启发式策略确定每个元件合适的摆放位置及旋转角度，并用以深度卷积神经网络为基础的策略价值网络来增强MCTS搜索的能力，来确定下一待摆放的元件，如此得到每回合最终排样方案，将当前排样方案结果与之前回合排样方案进行对比，来判断当前回合的比较优势，该回合的排样方案、比较优势又可作为训练数据，提高网络预测动作、评价局面的准确度，如此交替进行，直到训练结果不在提升；有效降低废料率，减少计算时间。
搜索关键词：	排样启发式自动排料卷积神经网络摆放位置策略确定方案结果价值网络模型训练网络模型网络预测训练结果训练数据准确度废料率排料搜索并用摆放
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于Alpha Zero以及结合启发式策略的自动排料方法，其特征在于，包括如下步骤：/nA0：选取启发式策略：针对当前排料问题的目标及性质，选取合适的启发式策略；/nA1：选择比较优势机制：指定与排样结果进行对比的比较优势机制来确定比较优势，并作为网络训练的依据；/nA2：选择训练方式和网络模型：根据排料问题的复杂程度及计算机的承受能力，确定网络模型以及训练方式；/nA3：模型训练：利用self play方法产生训练样本，并对网络模型结构进行训练；/n其中，所述模型训练过程包括如下：/nA31：设定启发式策略以及比较优势机制；/nA32：初始化迭代数iter＝0；/nA33：初始化回合数eps＝0；/nA34：利用MCTS搜索结合比较优势进行自动排料生成训练样本；/nA35：eps＝eps+1并判断eps<neps；若是，则执行步骤A34；若否，则执行步骤A36；/nA36：利用生成的训练样本进行模型训练，网络模型的损失函数为动作概率、网络模型输出的动作概率的交叉熵与比较优势、网络模型输出价值函数的均方误差的和；/nA36：iter＝iter+1并判断iter<niter；若是，则执行步骤A33；若否，则训练完毕；/nA04：自动排料：使用训练好的网络模型增强MCTS的搜索能力，完成自动排料。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥黎曼信息科技有限公司，未经合肥黎曼信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910924758.7/，转载请声明来源钻瓜专利网。

上一篇：一种基于IPSO-LSTM的超短期电力负荷预测方法
下一篇：一种随机模糊分析的农业土地的优选方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Alpha Zero以及结合启发式策略的自动排料方法在审

专利文献下载