首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于增强学习的串行生产系统生产维护联合优化方法有效

申请号：	202110264883.7	申请日：	2021-03-11
公开（公告）号：	CN113112051B	公开（公告）日：	2022-10-25
发明（设计）人：	靳文瑞;易琦;周炳海	申请（专利权）人：	同济大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/04;G06K9/62;G06F30/27
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	赵继明
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于增强学习串行生产系统维护联合优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于增强学习的串行生产系统生产维护联合优化方法，其特征在于，包括以下步骤：

通过马尔科夫链表示串行生产系统的系统状态，确定串行生产系统的状态转移概率的计算方法，构建包括状态空间、动作空间、转移矩阵和成本函数的马尔科夫模型；

采用贪心策略求解所述马尔科夫模型，从所述动作空间中选取维护策略，构建回放记忆数据集；采用所述回放记忆数据集对预先建立的神经网络进行迭代训练，直至达到预设的迭代终止条件；

采用训练后的所述神经网络，获取实际串行生产系统的生产维护策略；

所述系统状态的表达式为：

s(t)＝[α₁(t),...,α_M+1(t),b₁(t),...,b_M(t)]

b_m(t)＝b_m(t-1)+TH_m(t)-TH_m+1(t)

式中，s(t)为系统状态，t为时间，TH_m(t)为在时间t机器M_m的产量，M_m为生产系统的第m台机器，α_M+1(t)为机器M_m的运行状态变量，1表示在在时间t机器m处于加工工件状态，反之为0，b_M(t)为在时间t缓冲区B_m的容量；

所述串行生产系统的系统状态的转移概率的计算过程包括：

计算所述串行生产系统中各机器的状态转移概率，从而计算所述系统状态的转移概率，所述串行生产系统中各机器的状态转移概率的计算表达式为：

式中，为时间t的机器状态序列，为各台机器在t时刻的维护决策c_m(t)的序列，p_m为第m台机器的转移概率；

所述系统状态的转移概率的计算表达式为：

式中，s(t)为系统在t时刻的状态；

所述马尔科夫模型的求解目标是找到最优维护策略π^*，最小化长期期望成本，即

当选择策略π时，带折扣因子的期望成本的表达式为：

式中，为每个时间单位的决策成本，s为系统状态，E_π为选择策略π时，带折扣因子的期望成本，γ^t(0＜γ^t＜1)为表示折扣因子；

所述马尔科夫模型的目标函数的表达式为：

式中，s′为下一个时刻的机器状态，V(s′)为下一个状态s′的值函数。

2.根据权利要求1所述的一种基于增强学习的串行生产系统生产维护联合优化方法，其特征在于，所述TH_m(t)的计算表达式为：

式中，v_m(α_M(t))为机器M_m在状态α_M(t)下的速度。

3.根据权利要求1所述的一种基于增强学习的串行生产系统生产维护联合优化方法，其特征在于，所述决策成本的计算表达式为：

式中，g^b为单位库存成本，g^-为单位缺货成本，x^-(t)＝v_M+1(α_M+1(t))-TH_M+1，g^m(t)表示维护成本，即

4.根据权利要求1所述的一种基于增强学习的串行生产系统生产维护联合优化方法，其特征在于，所述回放记忆数据集的构建过程包括：

有ε的概率从动作空间随机选取有1-ε的概率根据第一算式选取所述第一算式的表达式为：

构建经验存进回放记忆数据集D_t＝(e₁,....,e_t)中，为系统在状态s+1时的最优价值函数，为神经网络中函数逼近权重。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同济大学，未经同济大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110264883.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种可回收重复利用的荧光传感器及其制备方法
下一篇：一种可防菌的医用便携橡胶塞

同类专利

专利分类

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top